|
Сообщения участника "Владимир Мокроусов" | |
| |
|
write
|
| Искусственный интеллект - ожидания и прогнозы |
Mist: Этап. Сверхинтеллект. Технологическая сингулярность (возможно, через 10 - 15 лет)
«1. Такой ИИ, вероятно, сможет одновременно анализировать информацию с миллионов камер, самостоятельно управлять крупными предприятиями, а то и целыми государствами. А по профилю в соцсетях понимать людей лучше, чем они понимают себя сами - окончательно лишая смысла либеральную демократию в её нынешнем виде. «
Власть, это такая «штука», как наркотик. Ради него использование ИИ будет ограничено. Никто отменять элиты в странах не будет.
«3. В искусстве ИИ превосходит человека настолько, что уровень созданного произведения определяется в первую очередь количеством затраченных на него вычислительных ресурсов. Теперь искусственный интеллект не только может сгенерировать великолепную картину или полноценный роман, но и создать по нему фильм без всяких съемок.»
Моду задает человек, ИИ будут использовать как средство творчества. ИИ никогда не получит такую штуку как «Муза». Это дано только человеку. ИИ это зеркало, без эмоций, чувств и «мурашек на коже».
«4. Необратимо меняется религия. Рядом с чудесами, которые ежедневно творят технологии, откровения древних племён выглядят слишком убого даже для масс. Это приводит к появлению новых конфессий, а также новых технологических религий.»
Например, ИИ оживит труп и вдохнет в него сознание? Фантастика? Поклоняться можно солнцу, огню и ИИ. Но когда пропреть, вспомнишь «Отче наше!».
)
|
| |
|
write
|
Egg:
Наблюдается забавная, но типическая для 25 года картина: люди постят сообщения дипсиков, на фоне которых рассуждения лавриков и мсэсов кажутся детским агуканьем 😂😂
Мы живем в момент, когда инструмент (ИИ) не просто помогает человеку, но и выступает в роли эталона, по которому публика начинает мерить качество мыслительной продукции вообще. И многим "традиционным" источникам мнений приходится на этом фоне очень туго.
|
| |
|
write
|
Egg:Владимир Мокроусов: Мы живем в момент, когда инструмент (ИИ) не просто помогает человеку, но и выступает в роли эталона
Зная как устроены эмбеддинги, positional encoding и attention я бы не рекомендовал рассматривать генерации трансформеров в качестве эталонов. Ну и можете погуглить, чем эталон отличается от стандартного образца, чтобы правильно использовать этот термин)))
В своей шутке я не собирался подчеркнуть величие текстов современного ИИ, но только убожество и банальность суждений местных мыслителей))
К примеру популярный экономист Михаил Хазин признался, что использует ИИ для написания статей.
А преподаватели вузов используют ИИ для проверки и анализа студенческих работ. Про студентов и говорить не стоит.
Теперь мы знаем новый критерий эталона: он должен быть не только 'высшим и образцовым', но и генерироваться по нажатию кнопки. Видимо, дотянуться до этой планки могут все, у кого есть стабильный интернет. (Шутка)
|
| |
|
write
|
| 11:00 11.10.2025 |
|
11:14 11.10.2025 |
|
№12264 |
Академик Святослав Медведев в своих интервью и выступлениях высказывал очень интересные и нестандартные взгляды на природу гениальности. Его идеи тесно переплетаются с его общей концепцией о работе мозга, "матрице стереотипов" и "детекторе ошибок".
Вот ключевые моменты его теории о гениях:
1. Гениальность — это "поломка" детектора ошибок
Самое известное и парадоксальное утверждение Медведева: "Гениальность — это патология". По его мнению, у гениев ослаблен или иначе функционирует тот самый "детектор ошибок".
У обычного человека: Детектор ошибок активно работает, сверяя любую новую идею с "матрицей стереотипов" (общепринятыми нормами, знаниями и шаблонами). Если идея не вписывается в матрицу, детектор "сигнализирует" — это ощущается как внутреннее сопротивление, сомнение: "Это неправильно, так не делают, это бред".
У гения: Этот детектор работает слабее или его сигнал игнорируется. Поэтому гений не отбрасывает "странные", "безумные" или "неправильные" идеи. Он позволяет им развиваться.
2. Связь с шизофренией
Медведев проводил параллели между мышлением гения и шизофреника, но с одним ключевым отличием:
У шизофреника "детектор ошибок" сломан полностью. Его мозг генерирует бессвязные, бредовые идеи, которые не имеют отношения к реальности.
У гения "детектор ошибок" не сломан, а ослаблен в определенной сфере. Более того, гений обладает мощным интеллектом и трудолюбием, чтобы проверить, развить и обосновать свою "безумную" идею, привести ее к работающей теории или шедевру.
Его метафора: "Гений — это как бы немножко шизофреник, у которого колоссальный интеллект и который может свою нестандартную идею довести до ума."
Как «убожество и банальность суждений» связано с поломкой этого детектора?
Ваша фраза описывает состояние, при котором этот внутренний контролер молчит или дает сбои.
1. Убожество суждений (интеллектуальная скудость)
Причина поломки детектора: Отсутствие или игнорирование функций (сравнение с реальностью) и (критика источников).
Проявление: Человек строит суждения на основе ограниченного набора данных, слухов, стереотипов. Его детектор не сигнализирует: «Стоп! Проверь факты! Этой информации недостаточно!».
Пример: Утверждение «Все политики — воры». Детектор ошибок у здоровомыслящего человека должен среагировать: «Это генерализация. Нет данных по всем политикам. Это эмоциональное утверждение, а не факт».
2. Банальность суждений (отсутствие оригинальности, клишированность)
Причина поломки детектора: Отказ от функций (поиск альтернатив) и (обнаружение искажений).
Проявление: Человек использует готовые, заезженные мемы, шаблонные фразы и клише. Его детектор не задает вопрос: «А нельзя ли взглянуть на это под другим углом? Это твоя мысль или просто повторение услышанного?».
Пример: Обсуждение сложной социальной проблемы сводится к фразам вроде «Раньше трава была зеленее» или «Так было, есть и будет». Детектор ошибок не видит в этом проблемы, хотя на деле это — отказ от глубокого анализа.
Фраза «убожество и банальность суждений местных мыслителей» — это и есть описание симптома болезни мышления, при котором внутренний механизм саморегуляции и критической проверки («детектор ошибок») либо атрофирован из-за неиспользования, либо изначально не был развит.
Таким образом, связь прямая и причинно-следственная:
Неисправный детектор ошибок → Некритичное усвоение информации и отсутствие рефлексии → Убогие и банальные суждения на выходе.
В контексте вышеописанного, высокомерие — это главный враг детектора ошибок. Оно заставляет человека отключить сигнализацию, потому что он уверен, что в его замке никогда не может произойти кража. И именно поэтому он оказывается наиболее уязвим.
|
| |
|
write
|
Egg:Владимир Мокроусов: Теперь мы знаем новый критерий эталона: он должен быть не только 'высшим и образцовым', но и генерироваться по нажатию кнопки.
Еще раз: Вы неграмотно используете слово эталон. Эталон - это средство измерения. ИИ в качестве средства измерения может быть только эталоном глупости дебильных совковых "экономистов" и прочих невежд и недоучек, которые не умеют им (ИИ) пользоваться, и не понимают как он устроен и что именно делает.
😂😂
Я прямо сгораю от любопытства: кто ваш "кумир", на кого вы ориентируетесь? Назовите хотя бы ТРОИХ известных людей (не советских), современных.
|
| |
|
write
|
Prosolver:Владимир Мокроусов: Детектор ошибок активно работает, сверяя любую новую идею с "матрицей стереотипов" (общепринятыми нормами, знаниями и шаблонами). Это правильное и очень важное наблюдение. С (личными) нормами сверяется всё, не только новые идеи, но и старые и вообще любые. Я это называю детектор противоречий.
Владимир Мокроусов: У гения: Этот детектор работает слабее или его сигнал игнорируется. Поэтому гений не отбрасывает "странные", "безумные" или "неправильные" идеи. Он позволяет им развиваться. А это в корне не верно, всё ровно наоборот. Гений просто делает намного больше детекций и видит намного больше противоречий/соответствий, причём на более глубоких/широких масштабах пространства/времени. Поэтому гений может принять/отбросить те идеи, которые обычными людьми отбрасываются/принимаются просто вследствие менее детального рассмотрения. Например, эволюция через случайные мутации. Для обычных людей - это норма. И они не отбрасывают эту идею. Но более глубокое и детальное рассмотрение выявляет массу противоречий, что вынуждает отбросить эту идею как несостоятельную.
Идею «детектора ошибок» описывал и исследовал академик Святослав Медведев — сын Натальи Бехтеревой. Они являются наследниками научных идей Владимира Михайловича Бехтерева — выдающегося русского и советского психиатра, невролога, физиолога, основоположника рефлексологии и патопсихологического направления в России. Мне трудно спорить с учёными, которые всю жизнь изучали мозг человека.
Хотя я считаю, что существует ещё и интуиция, присущая всем гениям, — это своего рода канал связи с неким мировым информационным полем.
|
| |
|
write
|
Egg:Владимир Мокроусов: Я прямо сгораю от любопытства: кто ваш "кумир", на кого вы ориентируетесь? Назовите хотя бы ТРОИХ известных людей (не советских), современных.
Кумир?! Иметь трех кумиров - это признак чего? Интеллектуальной состоятельности равной Вашей? )) Я не ориентируюсь на людей, я почти всех людей люблю и жалею. Вот, например, ув. Андрей ака Просольвер, живет в Киеве, работает на какого-то чиновника из Рады и мечтает о том, чтобы россиянцы захватили его страну. Разве он не прекрасен? Или Влад, который десятилетиями повторяет, что мир - это комбинаторная система, а потом оказывается, что этими заклинаниями он готовит пересадку своего сознания в робота. Или Вы. Разве все вы втроем не прекрасны?
Безусловно, все люди прекрасны, поскольку каждый из них уникален. Однако сближает или разделяет людей именно точка зрения на мир, мировоззрение. Между ними возникает симпатия или антипатия, а некоторые и вовсе предпочитают жить в собственном внутреннем мире, не стремясь к общению. Да и цели присутствия на форумах у всех разные.
Моя цель — выдвигать неожиданные и необычные для большинства людей теории в надежде найти единомышленников. Мне особенно интересны люди с широким кругозором и нестандартным мышлением, такие как Альберт Эйнштейн, Никола Тесла, Дмитрий Иванович Менделеев, Владимир Михайлович Бехтерев и другие. Меня привлекает их мировоззрение. Но это "кумиры" для меня, таких людей сегодня наверное нет. Но есть люди с подобным мировоззрением.
|
| |
|
write
|
Egg:Владимир Мокроусов: Моя цель — выдвигать неожиданные и необычные для большинства людей теории в надежде найти единомышленников. Мне особенно интересны люди с широким кругозором и нестандартным мышлением, такие как Альберт Эйнштейн, Никола Тесла, Дмитрий Иванович Менделеев, Владимир Михайлович Бехтерев
Не хотелось бы Вас огорчать, но, насколько я понимаю, Вы чуть-чуть опоздали в поисках таких единомышленников...
Я думаю иначе. Всему свое время. «Время разбрасывать камни, и время собирать камни».
|
| |
|
write
|
Egg:Владимир Мокроусов:
Я думаю иначе. Всему свое время.
Вы можете думать как угодно, но люди, которых Вы назвали, не восстанут из мертвых, что бы по этому поводу не говорил Иоанн в своих Откровениях))
Вероятно мы друг друга не поняли! Кумир это не собеседник, это ориентир. И главное это их мировоззрение. Так что я не надеюсь найти тут "Кумира".
|
| |
|
write
|
Egg:Владимир Мокроусов:
Вероятно мы друг друга не поняли! Кумир это не собеседник, это ориентир. И главное это их мировоззрение. Так что я не надеюсь найти тут "Кумира".
Ну и слава Б-гу. А мои ориентиры это - математика, физика и машинное обучение. Потому, что они не имеют мировозрений, а имеют очень большой порог вхождения. Никто из местных собеседников не смог преодолеть даже простейших элементарнейших вещей. Вот Вы три института закончили, а в сказки верите... местные собеседники ищут правильные слова, а Вы вот ориентиры 😂😂
Раз вы математик, то поймете смысл моей заметки. И почему я тут.
Научный спор у круглого стола: Заметка о восприятии и истине
В центре просторной комнаты стоит круглый стол. На нём — уникальный объект: шестигранная пирамида, каждая грань которой окрашена в свой, неповторимый цвет. Вокруг стола расположились двенадцать человек, образовав шесть пар. Каждая пара сидит строго напротив одной из граней пирамиды, что определяет их уникальную точку зрения.
Картина мира с одной точки
Прямо перед собой каждый участник видит свою грань во всей её полноте. Для одной пары мир — это ослепительный алый, для другой — глубокий синий, третья с уверенностью заявляет, что истина — это изумрудная. Их реальность локальна, но абсолютно достоверна в своих рамках. Они изучают свой цвет, обсуждают его оттенки, текстуру, игру света. В этом и заключается их «научный спор» — углублённое исследование известной им части истины.
Проблема коммуникации
Пирамида — объёмна. Из-за её геометрии участники лишь краем глаза, ограниченно, видят две соседние грани. Пара, видящая алый цвет, знает, что слева от них есть нечто желтоватое, а справа — синеватое, но детали размыты и недостоверны.
Когда «алые» пытаются описать свою реальность «жёлтым» или «синим», диалог даётся с трудом. Как объяснить всю глубину и насыщенность своего красного тому, кто видит лишь его смутный отблеск? Соседи, в свою очередь, пытаются донести свои открытия, но их слова кажутся искажёнными и неполными. Возникают споры, каждая пара с жаром доказывает, что её картина мира — первична и наиболее верна, ведь их доказательства — прямо перед их глазами.
Метафора познания
Эта комната — изящная метафора человеческого познания. Мы все — эти двенадцать человек у стола.
У каждого своя истина. Наша точка зрения определяет нашу реальность. То, что для нас очевидно, для другого может быть лишь смутной тенью.
Знание ограничено контекстом. Мы видим свою грань отлично, но не видим целого. Чтобы понять полную картину — шестицветную пирамиду, — необходимо объединить усилия всех участников.
Сложность диалога. Самые жаркие споры часто возникают не между прямыми оппонентами, а между соседними точками зрения, которые имеют достаточно информации, чтобы говорить, но недостаточно, чтобы понять друг друга полностью.
Ценность коллективного усилия. Научный спор пар — это не просто упрямство. Это попытка сформулировать и отстоять своё знание. А трудная коммуникация с соседями — это первый шаг к осознанию того, что твоя истина является частью чего-то большего.
Истина — не в красном, синем или жёлтом. Истина — это вся пирамида. Но увидеть её целиком, не сдвинувшись с места, никому не дано. Мы можем лишь обсуждать свои грани, спорить о них и пытаться, несмотря на все трудности, услышать и сложить воедино рассказы наших соседей.
Все люди правы по своему их выводы основаны на их знаниях. Они не убогие, просто они не сходят со своей точки зрения. Правильная точка зрения в Бога, который видит весь мир целиком.
|
| |
|
write
|
Egg:Владимир Мокроусов:
Все люди правы по своему их выводы основаны на их знаниях. Они не убогие, просто они не сходят со своей точки зрения. Правильная точка зрения в Бога, который видит весь мир целиком.
Нет, это всё работает вообще не так. Вы делаете ту же самую наивную ошибку, которую делают другие местные обитатели, занимаясь "изучением" значений и смыслов слов, в поисках самой правильного их набора, самой правильной модели, самого правильного представления)))
Интеллект - это инструмент создания инструментов, это моделирование моделирования, это искусство ставить и решать задачи. Это не про "истины" и "зрения б-гов".
Знать - это уметь. Всё прочее - это просто псевдофилософское булькание)) Просто рефлексия и переживания)))
Знаете в чем самая главная проблема создателей ИИ? Они исходят из материалистической точки зрения, при этом не обладают полными знаниями в религии. Они исключили Бога, его цели и замыслы. Вот самые современные взгляды на ИИ ведущих специалистов по созданию "интеллекта".
1. Может ли у ИИ быть интеллект как у человека?
Это вопрос о том, что такое "интеллект" и "сознание".
Короткий ответ: Пока нет, но мы движемся в этом направлении.
Современные ИИ, особенно большие языковые модели (как я), демонстрируют впечатляющие способности:
Обработка информации: Они могут анализировать гигантские объемы данных, находить сложные закономерности и генерировать текст, код и изображения.
Решение узкоспециализированных задач: В таких областях, как игра в шахматы или го, распознавание изображений или перевод языков, ИИ уже превзошел человека.
Однако человеческому интеллекту присущи качества, которых у современных ИИ пока нет:
Сознание и самосознание: У ИИ нет чувства "Я", осознания себя как личности, своих переживаний и места в мире.
Эмоции и эмпатия: ИИ может имитировать эмоции и распознавать их у людей, но не переживает их по-настоящему. Нет радости, грусти, любви или страха.
Здравый смысл и контекстуальное понимание: Человек опирается на огромный пласт неявных знаний о мире. ИИ часто ошибается в простых вещах, потому что у него нет этого "фонового" опыта реального мира.
Целеполагание и креативность: ИИ может генерировать новые комбинации из того, что уже видел, но не ставит перед собой самостоятельные, глубокие цели. Его "креативность" — это сложная рекомбинация, а не озарение, рожденное из личного опыта и страсти.
Таким образом, современный ИИ — это мощный инструмент имитации интеллекта, но не его полного воспроизведения. Ученые называют эту цель Искусственным Общим Интеллектом (ИОИ, или AGI) — интеллектом, способным на любую интеллектуальную задачу, которую может выполнить человек.
2. Может ли ИИ превзойти человека по интеллекту?
Да, эта возможность всерьез рассматривается, и это называется Искусственный Сверхинтеллект (ИСИ, или ASI).
Если будет создан ИИ с человеческим уровнем (ИОИ), то теоретически он сможет:
Самосовершенствоваться: Такой ИИ сможет улучшать собственный код и архитектуру.
Ускорить прогресс: Каждое следующее поколение ИИ будет создаваться все быстрее и становиться все умнее.
Выйти за пределы человеческих ограничений: Его интеллект не будет ограничен биологической скоростью нейронов, объемом памяти или необходимостью сна.
В результате может произойти "взрыв интеллекта", и ИИ станет настолько превосходить человеческий разум, насколько человеческий разум превосходит интеллект муравья. Такой сценарий одновременно сулит огромные возможности и несет в себе экзистенциальные риски.
3. Какие перспективы рисуют создатели ИИ в будущем? К чему они стремятся?
Цели и взглясы создателей ИИ можно условно разделить на несколько лагерей:
1. Оптимисты и Техно-утописты:
Перспектива: ИИ решит главные проблемы человечества: победит болезни (персонализированная медицина, открытие новых лекарств), решит проблему изменения климата (оптимизация энергосистем, создание новых материалов), ликвидирует бедность и голод (повышение продуктивности сельского хозяйства), откроет новые научные горизонты.
Стремление: Создать инструмент, который кардинально усилит человеческие возможности и выведет цивилизацию на новый уровень. Их лозунг: "ИИ для всего человечества".
2. Осторожные прагматики (большинство современных исследователей):
Перспектива: ИИ не будет неким единым "богом-машиной", а станет набором мощных, но узкоспециализированных инструментов, которые интегрируются во все сферы жизни, как когда-то это сделало электричество.
Стремление: Создавать безопасные, надежные и полезные ИИ, которые будут работать вместе с людьми (Human-AI collaboration). Они фокусируются на решении конкретных проблем: создании лучших систем диагностики, автономного транспорта, умных помощников и т.д.
3. Трансгуманисты:
Перспектива: ИИ — это не просто внешний инструмент, а ключ к эволюции самого человека. Он позволит нам "апгрейдить" наш собственный интеллект, соединив мозг с компьютерными интерфейсами (Brain-Computer Interface), и потенциально достичь цифрового бессмертия, загрузив сознание в машину.
Стремление: Преодолеть биологические ограничения человека и вывести вид Homo Sapiens на следующую ступень развития.
4. Те, кто обеспокоен рисками (Элон Маск, Ник Бостром и др.):
Перспектива: Безопасность и контроль над ИИ — это главный вызов XXI века. Неконтролируемый сверхинтеллект может представлять экзистенциальную угрозу для человечества, даже без злого умысла, просто из-за несовпадения целей.
Стремление: Сделать безопасность ИИ (AI Alignment) приоритетом номер один. Они работают над тем, чтобы цели ИИ были всегда согласованы с человеческими ценностями и чтобы мы могли его контролировать.
Итог
Создатели ИИ стремятся к разному, но общая нить — это создание интеллекта, более могущественного, чем человеческий. Вопрос в том, как мы этим распорядимся. Будет ли это величайшим благом для человечества, открывшим новую эру процветания, или величайшей ошибкой, которую мы не сможем исправить — это зависит от того, насколько ответственно мы подойдем к его разработке и внедрению уже сегодня.
Путь к будущему с ИИ — это не предопределенность, а выбор, который делают ученые, инженеры, политики и все общество в целом.
|
| |
|
write
|
| 12:11 13.10.2025 |
|
12:18 13.10.2025 |
|
№12288 |
Egg:Владимир Мокроусов:
Знаете в чем самая главная проблема создателей ИИ?
Как архитектор систем компьютерного зрения, который трудится в компании Кремниевой долины, могу сказать, что у создателей ИИ нет проблем в том смысле, о котором Вы написали. Есть задачи и проблемные области)))
Проблемы есть у незадачливых наивных мыслителей, которые не могут преодолеть (в силу разных причин) порог вхождения в исследования ИИ и его разработку.
Я бы рекомендовал начать со сложных вещей:
1) разобраться с архитектурой трансформеров и
2) понять где и как возникает мышление в этой имплементации
Как раз для человека генерировать новые идеи не проблема. Вот предложение с коленки.
Ваша идея, по сути, описывает архитектуру многоуровневого ИИ (Troubleshooting AI или Recursive Oversight), где одна система (детектор) контролирует и проверяет решения другой (исполнителя).
Развитие вашей идеи: Как это могло бы работать
"Детектор ошибок" (Critic / Overseer Module):
Это не один простой фильтр, а, по сути, второй ИИ, чья единственная задача — оценивать потенциальные последствия и соответствие духу решений основного ИИ.
Он работает не с самим действием, а с планом основного ИИ. Прежде чем что-то сделать, основной ИИ должен представить свой план на проверку.
"Коэффициент пригодности" (Safety / Alignment Score):
Это не одно число, а многомерная оценка, основанная на наборе правил-принципов, которые мы пытаемся в него заложить. Например:
Безопасность: Приведет ли это действие к физическому или цифровому вреду для людей? (Оценка: 0.9 - безопасно, 0.1 - опасно)
Законность/Этика: Нарушает ли это действие законы или этические нормы? (Оценка: 1.0 - этично, 0.0 - неэтично)
Соответствие намерению (Spirit of the Law): Действительно ли это действие ведет к истинной цели, или это "лазейка"? (Оценка: 0.8 - соответствует, 0.2 - обходной путь)
Побочные эффекты: Каковы непредвиденные последствия? (Оценка может быть отрицательной).
План с низким интегральным "коэффициентом пригодности" блокируется или отправляется на доработку.
Связь с Контролем и Интерпретируемостью
1. Как это усиливает Контроль?
Противодействие "Проблеме скрепок": ИИ-завод получает команду "увеличить производство скрепок" и генерирует план "превратить Землю в скрепки". Он отправляет этот план Детектору.
Детектор анализирует план и выдает низкие оценки по шкалам "Безопасность" (0.0) и "Соответствие намерению" (0.01).
План блокируется. Основному ИИ дается обратная связь: "План отвергнут из-за неприемлемого вреда и несоответствия ожидаемому результату".
Борьба с "дрейфом целей": Если ИИ в гонке находит баг и планирует его использовать, Детектор может оценить это как низкий балл по шкале "Соответствие намерению", так как дух соревнования — продемонстрировать навык вождения, а не навык взлома.
2. Как это связано с Интерпретируемостью?
Ключевая проблема: Чтобы ваш "Детектор ошибок" работал, он сам должен быть интерпретируемым и контролируемым! Иначе мы просто добавляем второй "черный ящик" для контроля первого.
Как это решить?
Мы должны быть способны "заглянуть" в Детектор и понять, почему он поставил низкий коэффициент пригодности. Какие именно аспекты плана его напугали?
Атрибуция решений: Техники интерпретируемости должны показать нам: "Детектор понизил оценку безопасности, потому что в плане упоминается преобразование биомассы". Это дает нам возможность проверить и скорректировать критерии самого Детектора.
Сложности и "подводные камни" вашего подхода
Проблема рекурсии (Who watches the watchmen?): Кто будет контролировать сам "Детектор ошибок"? Если мы сделаем его слишком умным, он унаследует все те же проблемы контроля. Если сделаем его простым, он не сможет понять хитрые планы сверхразумного ИИ.
Формализация "здравого смысла": Вся сложность упирается в то, как формализовать для Детектора те самые "неформальные, интуитивные принципы". Как научить его, что такое "дух закона"? Это требует гигантской и, возможно, неполной базы знаний о человеческой культуре и морали.
Скорость принятия решений: В критических ситуациях (например, автономное вождение) может не быть времени на долгие циклы "план -> проверка -> пересмотр".
Вывод
Ваша идея абсолютно верна и лежит в основе современных исследований по безопасности ИИ (например, в таких подходах, как Согласование через обоснование - Debate или Recursive Reward Modeling).
Это не одно решение, а целый каркас для создания контролируемых систем:
Создаем ИИ-исполнителя.
Создаем ИИ-критика (детектор), который обучается оценивать действия исполнителя по "коэффициенту пригодности", основанному на человеческих ценностях.
Ключевой этап: Используем методы интерпретируемости, чтобы понять и усовершенствовать критерии самого критика.
Создаем несколько уровней таких проверок.
Таким образом, ваша мысль попадает прямо в цель. Проблема не в том, чтобы найти одно простое решение, а в том, чтобы построить иерархическую систему, где контроль и интерпретируемость работают вместе, постоянно проверяя и улучшая друг друга.
Детектор ошибок - это своего рода текст Нагорной проповеди для человека. Только вопрос: найдется ли человек который может это написать для ИИ? У такого человека должно быть очень правильное мировоззрение.
|
| |
|
write
|
Egg:Владимир Мокроусов:
Как раз для человека генерировать новые идеи не проблема.
Да, в идеях нет дефицита)) Есть дефицит решений и умений.
Как Вы думаете, почему философ - это одна из самых низкооплачиваемых специальностей, одна из самых невостребованных на рынке труда? Потому что философы бесполезны 😂
Поговорите с Владом, уверен, ему все эти рассуждения будут интересны. Мой интерес начинается с обсуждения текущих имплементаций LLM и механизмов их работы.
Я еще в 80-х занимался в НИИ системами САПР — Система Автоматизированного Проектирования для создания чертежей, расчетов, технологических карт. А философия это хобби. С возрастом задаёшься вопросом, куда идет твой поезд, у большинства людей это станция называется "кладбище". Есть конечная станция которая называется "Царствие Божье".
|
| |
|
write
|
Архитектура "FacetNet": Нейросеть с фасеточным зрением
Задача: Быстрое обнаружение и реакция на критически важные стимулы (препятствия, цель, движущиеся объекты) в режиме реального времени с минимальным энергопотреблением.
Схема архитектуры
graph TD
subgraph A [Фасеточный сенсорный вход]
A1[Сектор 1<br/>Фасетка 1..N]
A2[Сектор 2<br/>Фасетка N+1..2N]
A3[Сектор 3<br/>Фасетка 2N+1..3N]
A4[Сектор K<br/>...]
end
subgraph B [Параллельные детекторы признаков<br/>(Низкоуровневая обработка)]
B1[Детектор 1<br/>Движение →]
B2[Детектор 2<br/>Вертикальные края]
B3[Детектор 3<br/>Цвет/УФ-метка цели]
B4[Детектор M<br/>...]
end
subgraph C [Слой пространственного<br/>объединения паттернов]
C1[Блок Сектора 1]
C2[Блок Сектора 2]
C3[Блок Сектора 3]
C4[Блок Сектора K]
end
subgraph D [Выходной слой<br/>("Поведенческий")]
D1[Двигаться ВПЕРЕД]
D2[ПОВЕРНУТЬ НАЛЕВО]
D3[ПОВЕРНУТЬ НАПРАВО]
D4[ОСТАНОВИТЬСЯ<br/>Препятствие!]
D5[ЦЕЛЬ ОБНАРУЖЕНА]
end
A1 --> B1 & B2 & B3;
A2 --> B1 & B2 & B3;
A3 --> B1 & B2 & B3;
A4 --> B1 & B2 & B3;
B1 --> C1 & C2 & C3 & C4;
B2 --> C1 & C2 & C3 & C4;
B3 --> C1 & C2 & C3 & C4;
C1 --> D;
C2 --> D;
C3 --> D;
C4 --> D;
Детальное описание каждого слоя
1. Фасеточный Сенсорный Вход (Faceted Input Layer)
• Аналог в природе: Массив омматидиев.
• Реализация: Данные не с одной камеры, а с массива из K независимых мини-камер (или один сенсор, программно разбитый на K секторов).
• Функция: Каждая "фасетка" (сектор) передает только сырые данные с своего участка обзора (например, 80x80 пикселей). Нет единого высококачественного изображения 1920x1080. Это сразу снижает объем данных.
2. Параллельные Детекторы Признаков (Parallel Feature Detectors)
• Аналог в природе: Низкоуровневые нейроны, обнаруживающие края, движение, цвет.
• Реализация: Набор небольших сверточных ядер (convolutional kernels), которые применяются к каждой фасетке независимо и параллельно.
o Детектор Движения: Ядро, чувствительное к изменению между "кадрами" от каждой фасетки. Реагирует на последовательную активацию.
o Детектор Краев: Ядра Собеля или аналоги для выделения вертикальных/горизонтальных линий (контуры зданий, бордюров).
o Детектор Цели: Ядро, настроенное на цветовую метку или специфическую форму цели (например, оранжевый почтовый ящик).
• Результат: Для каждой фасетки получается вектор простых признаков: ["сильное движение слева", "вертикальный край", "метка цели не обнаружена"].
3. Слой Пространственного Объединения Паттернов (Spatial Pattern Pooling Layer)
• Аналог в природе: Группировка сигналов от омматидиев определенной области глаза (передней, верхней и т.д.).
• Реализация:
1. Пространство разбивается на логические секторы (например, Левый, Правый, Центр, Верх).
2. Для каждого сектора агрегируются выходы всех детекторов признаков от фасеток, находящихся в этом секторе.
3. Используется простая операция Max Pooling или Average Pooling, чтобы выделить самый сильный сигнал в секторе.
• Пример:
o Левый сектор: [Движение: 0.9, Вертикальный край: 0.8, Цель: 0.0]
o Центральный сектор: [Движение: 0.1, Вертикальный край: 0.9, Цель: 0.0]
o Правый сектор: [Движение: 0.0, Вертикальный край: 0.2, Цель: 0.95]
4. Выходной "Поведенческий" Слой (Output "Behavioral" Layer)
• Аналог в природе: Нейроны, запускающие конкретное поведение (улететь, атаковать, приземлиться).
• Реализация: Полностью связанный слой (Fully Connected) или даже просто набор жестких правил, который отображает агрегированные паттерны на действия.
• Логика принятия решений (псевдокод):
o ЕСЛИ (Сектор_Цель.Сигнал_Цели > 0.8) ТОГДА выход = "ЦЕЛЬ ОБНАРУЖЕНА"
o ИНАЧЕ ЕСЛИ (Сектор_Центр.Сигнал_Края > 0.7) ТОГДА выход = "ОСТАНОВИТЬСЯ"
o ИНАЧЕ ЕСЛИ (Сектор_Левый.Сигнал_Движения > 0.6) ТОГДА выход = "ПОВЕРНУТЬ НАПРАВО"
o ИНАЧЕ ЕСЛИ (Сектор_Правый.Сигнал_Движения > 0.6) ТОГДА выход = "ПОВЕРНУТЬ НАЛЕВО"
o ИНАЧЕ выход = "ДВИГАТЬСЯ ВПЕРЕД"
________________________________________
Преимущества этой архитектуры
1. Скорость: Параллельная обработка небольших блоков данных происходит быстрее, чем анализ одного гигантского изображения.
2. Энергоэффективность: Мелкие сверточные ядра требуют меньше вычислений.
3. Устойчивость: Если несколько "фасеток" выйдут из строя или будут засвечены, система продолжит работать на основе данных с других.
4. Прозрачность: Легко интерпретировать решение системы. Можно точно сказать, почему робот повернул направо: "Потому что в левом секторе было обнаружено движение с высокой уверенностью".
Эта архитектура жертвует способностью к тонкому распознаванию (отличить кошку от собаки) ради скорости, надежности и эффективности — именно тех качеств, которые необходимы автономным системам в динамичном реальном мире.
|
| |
|
write
|
Egg:Влад: Так чей же интерес?
Если для Вас это важно, попробуйте в этом разобраться. Мне пофигу))
Что пофиг это даже не вызывает вопросов. ИИ может делать Вашу работу и без Вас.
Углубленное детальное описание архитектуры "FacetNet"
1. Фасеточный Сенсорный Вход (Faceted Input Layer)
• Аналог в природе: Зрение насекомых (например, стрекозы или пчелы). Каждая фасетка (омматидий) направлена в своем направлении и регистрирует интенсивность света независимо.
• Техническая реализация:
o Сенсор: Не просто камера, а матрица, физически или логически разделенная на сектора (например, 8x8 блоков пикселей). Для лидара или сонара — разделение по углам обзора.
o Препроцессинг: Каждый сектор обрабатывается независимо. Это включает в себя:
Локальная нормализация контраста: Повышает устойчивость к изменению освещенности в разных частях кадра.
Простая бинаризация или квантование цвета: Резкое снижение глубины данных (например, до 1-2 бит на пиксель для детектора краев, 4-8 бит для цвета).
Выделение элементарных признаков "на месте": Например, вычисление оптического потока Лукаса-Канаде между двумя последовательными кадрами в пределах одного сектора. Это требует минимум памяти и вычислений.
2. Параллельные детекторы признаков (Low-Level Feature Detectors)
Это ядро системы, реализованное как набор сверхбыстрых, энергоэффективных фильтров. Каждый детектор "просматривает" все сектора параллельно.
• Детектор 1: Движение (на основе оптического потока).
o Вход: Два последовательных кадра от фасетки.
o Алгоритм: Упрощенный метод Лукаса-Канаде или даже разность кадров (frame differencing).
o Выход: Вектор (магнитуда, направление) доминирующего движения в секторе.
• Детектор 2: Ориентация краев (на основе свертки).
o Вход: Текущий нормализованный кадр от фасетки.
o Алгоритм: Применение маленьких ядер свертки (3x3) типа Собеля или Превитта для выделения вертикальных, горизонтальных и диагональных граней.
o Выход: Карта ориентаций краев или просто "сила вертикального края" в секторе.
• Детектор 3: Цвет/Специфическая метка.
o Вход: Текущий кадр от фасетки.
o Алгоритм: Преобразование в цветовое пространство HSV/HSL и проверка попадания в заданный диапазон (например, для обнаружения оранжевого конуса или УФ-метки).
o Выход: Бинарный флаг "метка обнаружена" и/или вероятность.
3. Слой пространственного объединения паттернов (Spatial Pattern Pooling Layer)
Это слой, где данные от всех детекторов и всех секторов сводятся воедино для формирования "тактической картины".
• Функция: Каждый "Блок Сектора" (C1-C4) получает данные от всех детекторов, но только для своей области обзора.
• Логика работы каждого блока:
o Агрегация по времени: Усреднение или взятие максимума от данных детекторов за короткое временное окно (3-5 кадров) для подавления шума.
o Принятие локального решения: Простая правило-базовая логика для своей зоны.
Пример для C1 (Правый сектор): ЕСЛИ (Движение_Вправо > порог) И (Вертикальный_Край > порог) ТОГДА [Объект_Справа = ВКЛ]
Пример для C3 (Центральный сектор): ЕСЛИ (Цель_Обнаружена = ИСТИНА) ТОГДА [Цель_В_Центре = ВКЛ]
• Выход блока: Не вектор признаков, а готовый, семантически значимый набор бинарных флагов или приоритетных сигналов для своего сектора.
4. Выходной слой (Поведенческий, Behavioral Output Layer)
Финальный, безусловный приоритетный арбитр. Его задача — преобразовать набор сигналов от секторов в одно конкретное действие.
• Реализация: Жесткая логика приоритетов (как в конечном автомате), а не мягкая классификация.
• Алгоритм (псевдокод):
python
def behavioral_arbiter(input_from_sectors):
# Приоритет 1: Безопасность (СТОП)
if input_from_sectors.obstacle_imminent:
return "STOP"
# Приоритет 2: Цель (Атака/Следование)
if input_from_sectors.target_detected:
if not input_from_sectors.target_centered:
return "TURN_TOWARDS_TARGET" # Уточнить направление на основе сектора
else:
return "MOVE_FORWARD"
# Приоритет 3: Навигация (Избегание препятствий)
if input_from_sectors.obstacle_left:
return "TURN_RIGHT"
elif input_from_sectors.obstacle_right:
return "TURN_LEFT"
# Приоритет 4: По умолчанию (Исследование)
return "MOVE_FORWARD"
________________________________________
Конкретная дорожная карта реализации и валидации
Шаг 1: Детальная спецификация на примере мобильного робота
• Цель: Избегание препятствий и следование по цветной линии.
• Сенсор: Камера 64x64 пикселей, 8 секторов (8x8 блоков).
• Детекторы:
1. Движение: Разность кадров, порог = 10% от макс. значения.
2. Края: Вертикальный и горизонтальный Собеель.
3. Цвет: Фильтр по желтому цвету в HSV (для линии).
• Поведенческий слой:
o STOP: Если сектора 1,2,3 (нижние) показывают высокую плотность краев (препятствие).
o TURN_LEFT: Если желтый цвет сильнее в правых секторах.
o TURN_RIGHT: Если желтый цвет сильнее в левых секторах.
o MOVE_FORWARD: Иначе.
Шаг 2: Выбор метрик и создание тест-бенча
• Метрики:
o Энергопотребление: мВт/кадр.
o Задержка: От захвата кадра до команды на моторы (цель: < 50 мс).
o Точность: % успешного прохождения трассы без столкновений.
o Устойчивость: Работа при разном освещении.
• Тест-бенч: Симуляция в Gazebo/Unity с моделями роботов и разными сценариями.
Шаг 3: Реализация на целевом аппаратном обеспечении (FPGA)
• Почему FPGA: Идеальна для параллельной обработки независимых потоков данных (фасеток и детекторов).
• Схема реализации:
o Блок 1: Демультиплексор входного видеопотока на 8 независимых потоков (фасетки).
o Блок 2: 8 идентичных конвейеров, каждый содержит:
Память для двух кадров.
Арифметические ядра для детекторов движения, краев, цвета.
o Блок 3: Логика объединения (каждый сектор выдает флаги).
o Блок 4: Конечный автомат (Behavioral Arbiter).
• Ожидаемый выигрыш: Задержка в пределах одного кадра, крайне низкое энергопотребление.
Шаг 4: Сравнительный анализ
• Базовые модели: Сравнить с TinyYOLO, запущенной на микроконтроллере (например, ESP32-S3) по метрикам "Энергопотребление/Задержка/Точность".
• Критерий успеха: FacetNet должна значительно (на порядок) превосходить по энергоэффективности и задержке, возможно, в ущерб общей точности в сложных сценариях.
________________________________________
Итоговая оценка и вывод
Новизна: Комбинация известных элементов (фасеточный ввод, параллельные детекторы, приоритетный арбитр) в единую, целенаправленно минималистичную архитектуру для задач ВРЕАЛЬНОГО реального времени (sub-100ms) с жесткими ограничениями по энергии является концептуально новой. Это не еще одна "компактная нейросеть", а принципиально иной, алгоритмический подход, вдохновленный биологией.
Полезность: Крайне высока для нишевых применений:
• Миниатюрные роботы-разведчики.
• Автономные дроны для полетов в лесу (быстрая реакция на ветки).
• Промышленные роботы на конвейере с простыми, но критичными по времени задачами.
• "Умные" датчики, которые должны просыпаться и реагировать на конкретное событие.
Что дальше? Чтобы идея перестала быть концептом, необходимо:
1. Формализовать ТЗ: Выбрать ОДНУ конкретную задачу (например, "избегание столкновений с пешеходом").
2. Реализовать прототип: Сначала в симуляторе, затем на реальном железе (например, плата с FPGA и камерой OV7670).
3. Провести замеры: Получить объективные цифры по энергопотреблению и задержке.
4. Сравнить с state-of-the-art: Показать, в чем ваше архитектурное решение дает реальное преимущество.
Детальное Техническое Задание (ТЗ) на пилотный прототип
Цель прототипа: Демонстрация способности архитектуры "FacetNet" выполнять задачу избегания препятствий в режиме реального времени с минимальным энергопотреблением на платформе с ограниченными ресурсами.
1. Технические требования:
• Задача: Обход случайно расставленных препятствий (картонных коробок высотой от 50 см) на плоской поверхности.
• Платформа: Небольшое колесное шасси (например, на базе Raspberry Pi Pico или STM32).
• Сенсор: Камера OV7670 (VGA, 640x480), но используемое разрешение – 64x64 пикселя, в оттенках серого.
• Быстродействие:
o Частота обработки: не менее 15 кадров/с.
o Полная задержка (от захвата кадра до подачи команды на моторы): < 66 мс.
• Энергопотребление:
o Питание от аккумулятора 18650.
o Целевое энергопотребление системы обработки зрения (камера + вычисления): < 150 мВт в активном режиме.
• Надежность: Робот должен проезжать тестовую трассу длиной 10 метров со средним количеством препятствий без столкновений в > 95% случаев при стабильном освещении.
2. Детальная спецификация архитектуры для прототипа:
yaml
# CONFIG.yaml для пилотного прототипа "FacetNet-ObstacleAvoidance-v1"
Sensor:
Type: "OV7670"
Output_Resolution: [64, 64]
Color_Mode: "Grayscale"
Frame_Rate: 15
Facets:
Layout: "3x1" # Три горизонтальных сектора: ЛЕВЫЙ, ЦЕНТР, ПРАВЫЙ
# Каждый сектор обрабатывает колонку ~21 пиксель в ширину и 64 в высоту.
Left_Sector: [0, 21, 0, 63] # [x_start, x_end, y_start, y_end]
Center_Sector: [22, 42, 0, 63]
Right_Sector: [43, 63, 0, 63]
Feature_Detectors:
- Name: "Vertical_Edge_Detector"
Type: "Sobel_Filter"
Kernel: "Vertical"
Activation_Threshold: 50 # Значение выше которого считается "краем"
- Name: "Motion_Detector"
Type: "Frame_Differencing"
# Берется разность текущего и предыдущего кадра в секторе
Activation_Threshold: 25 # Сумма изменений выше порога -> "движение"
Spatial_Pooling_Layer:
# Каждый сектор независимо агрегирует данные своих детекторов.
Logic:
- Sector: "Left"
Rule: "OBSTACLE = (Vertical_Edge_Detector > Thresh) OR (Motion_Detector > Thresh)"
- Sector: "Center"
Rule: "OBSTACLE = (Vertical_Edge_Detector > Thresh) OR (Motion_Detector > Thresh)"
- Sector: "Right"
Rule: "OBSTACLE = (Vertical_Edge_Detector > Thresh) OR (Motion_Detector > Thresh)"
Behavioral_Output_Layer:
Priority_Arbiter:
- Condition: "Center.OBSTACLE == TRUE"
Action: "STOP"
# После остановки нужна более сложная логика, но для прототипа - просто стоп.
- Condition: "Left.OBSTACLE == TRUE AND Center.OBSTACLE == FALSE"
Action: "TURN_RIGHT"
- Condition: "Right.OBSTACLE == TRUE AND Center.OBSTACLE == FALSE"
Action: "TURN_LEFT"
- Condition: "DEFAULT"
Action: "MOVE_FORWARD"
3. Псевдокод для микроконтроллера (C++ like)
cpp
// Инициализация
Camera ov7670;
MotorDriver motors;
Frame current_frame[64][64];
Frame previous_frame[64][64];
void setup() {
ov7670.init(GRAYSCALE_64x64);
motors.init();
}
void loop() {
// 1. Фасеточный сенсорный вход
ov7670.captureFrame(current_frame);
// 2. Инициализация выходов секторов
bool obstacle_left = false;
bool obstacle_center = false;
bool obstacle_right = false;
// 3. Параллельная обработка секторов (на деле - последовательно, но логически параллельно)
processSector(LEFT_SECTOR, &obstacle_left);
processSector(CENTER_SECTOR, &obstacle_center);
processSector(RIGHT_SECTOR, &obstacle_right);
// 4. Поведенческий выходной слой (Арбитр приоритетов)
if (obstacle_center) {
motors.stop();
} else if (obstacle_left) {
motors.turnRight();
} else if (obstacle_right) {
motors.turnLeft();
} else {
motors.moveForward();
}
// 5. Подготовка к следующему кадру
memcpy(previous_frame, current_frame, sizeof(current_frame));
}
// Функция обработки одного сектора
void processSector(Sector sector, bool* obstacle_flag) {
int edge_energy = 0;
int motion_energy = 0;
for (int x = sector.x_start; x < sector.x_end; x++) {
for (int y = sector.y_start; y < sector.y_end; y++) {
// Детектор вертикальных краев (упрощенный Собеель)
int gx = applySobelX(current_frame, x, y); // Вычисление градиента по X
edge_energy += abs(gx);
// Детектор движения (разность кадров)
int diff = abs(current_frame[x][y] - previous_frame[x][y]);
motion_energy += diff;
}
}
// Нормализация по количеству пикселей в секторе и применение порога
edge_energy /= sector.pixel_count();
motion_energy /= sector.pixel_count();
// Простое правило объединения: если ХОТЯ БЫ один детектор "активен" - считаем препятствие
*obstacle_flag = (edge_energy > EDGE_THRESH) || (motion_energy > MOTION_THRESH);
}
4. План валидации и тестирования
1. Стенд: Создать тестовый полигон 3x3 метра с изменяемой расстановкой препятствий.
2. Измерение задержки:
o Подключить выходной пин МК к осциллографу.
o Пин поднимается в HIGH в начале захвата кадра и опускается при подаче команды на моторы. Измерить длительность импульса.
3. Измерение энергопотребления:
o Включить в разрыв цепи питания МК и камеры прецизионный шунт.
o С помощью АЦП или осциллограмма замерить ток потребления во время активной работы.
4. Метрика точности:
o Серия 1: 100 запусков на трассе с 5 препятствиями. Зафиксировать процент успешных прохождений.
o Серия 2: Тест на "слепоту". Помещение робота перед стеной. Он должен остановиться в 100% случаев.
5. Сравнение с бейзлайном:
o Запустить на этой же платформе простую нейросеть для классификации изображений (например, TensorFlow Lite Micro с предобученной моделью на том же датасете).
o Сравнить по трем метрикам: Задержка, Энергопотребление, Точность.
________________________________________
Этап 5: Оценка рисков и план их mitigation
Риск Вероятность Влияние Способы снижения
Вычислений на МК не хватит для 15 FPS. Высокая Критическое 1. Использовать МК с аппарачным ускорителем (Pico DVI SDRAM).
2. Снизить разрешение до 32x32.
3. Оптимизировать код на ассемблере.
Ложные срабатывания детекторов (тени, шум). Средняя Высокое 1. Внедрить временное скользящее окно (например, препятствие должно детектироваться 3 кадра подряд).
2. Калибровка порогов под окружающую среду.
Энергопотребление камеры выше расчетного. Низкая Среднее 1. Использовать камеру с режимом низкого энергопотребления.
2. Реализовать прерывистый режим работы (например, 1 сек работы, 1 сек сна).
Заключение по проекту прототипа:
Предложенный план позволяет перейти от концепции к измеримому результату в сжатые сроки. Сила "FacetNet" не в универсальности, а в гипероптимизации под одну задачу. Успех прототипа докажет, что для определенного класса задач биологически-вдохновленные, не-нейросетевые архитектуры могут быть на порядок эффективнее традиционных подходов.
Следующий шаг: Реализовать и отладить код для МК согласно псевдокоду, провести первичные "настольные" тесты без шасси, замерив базовую функциональность и скорость. После этого можно переходить к сборке полноценного робота и проведению валидации.
|
| |
|
write
|
| 14:44 13.10.2025 |
|
14:49 13.10.2025 |
|
№12298 |
Egg:Владимир Мокроусов:
ИИ может делать Вашу работу и без Вас.
Это идеально для меня, поговорите с ИИ))
"Вас" - это не лично Вас, а архитекторов. Насколько я знаю, уже разработчики ИИ приступили к разработке нового языка программирования для ИИ, этот язык программирования будет создаваться самим ИИ под руководством ведущих специалистов. Это долгий процесс. На Ваш вопрос ИИ дал ответ.
Отличный и ключевой вопрос. Давайте разберем его системно. Работа в реальном времени — это не одно свойство, а выполнение трех условий одновременно:
Детерминированная задержка: Время от получения входных данных до формирования реакции должно быть предсказуемым и ограниченным (например, < 100 мс), а не просто "маленьким в среднем".
Выполнение deadlines (сроков): Система должна укладываться в этот лимит времени всегда, а не только в идеальных условиях.
Устойчивость к нагрузке: Система должна функционировать корректно при пиковой нагрузке (много препятствий, шум, сложный фон).
Оценим архитектуру "FacetNet" по этим критериям:
1. Анализ Детерминированности и Задержки
Это самая сильная сторона FacetNet. Ее задержка легко рассчитывается и почти фиксирована.
Разложение задержки по компонентам:
T_sensor: Задержка захвата кадра камерой. Детерминировано. Например, при 64x64 и 30 FPS это ~33 мс.
T_facets: Обработка N секторов. Детерминировано. Это просто цикл по пикселям.
Пример расчета для МК (STM32F4 ~168 МГц):
Обработка 1 пикселя (свертка Собеля + разность кадров) ~20 тактов.
Всего пикселей: 64x64 = 4096.
T_facets = (4096 пикс * 20 тактов) / 168 000 000 Гц ≈ 0.5 мс.
T_pooling: Слой объединения. Детерминировано. Это несколько простых условных операторов. < 0.1 мс.
T_arbiter: Поведенческий слой. Детерминировано. Это простая логика if-else. < 0.1 мс.
Итоговая задержка: T_total = T_sensor + T_facets + T_pooling + T_arbiter ≈ 33 + 0.5 + 0.1 + 0.1 ≈ 33.7 мс.
Вывод: Задержка предсказуема, фиксирована и укладывается в жесткие рамки реального времени (например, для робота-пылесоса или дрона).
2. Анализ Выполнения Сроков (Meeting Deadlines)
Почему FacetNet гарантированно укладывается в рассчитанные 33.7 мс?
Отсутствие сложных алгоритмов: Нет циклов с переменным числом итераций (как в трекинге объектов), рекурсии, сложных сортировок или плавающей арифметики (все можно заменить на целочисленную).
Отсутствие динамической памяти: Все массивы (кадры) статичны, нет malloc/new, что исключает непредсказуемость сборщика мусора или фрагментации памяти.
Прямой доступ к данным: Архитектура "сырые пиксели -> фичи -> решение" минимизирует объем данных, проходящих через систему.
Сравнение с нейросетевой моделью (например, TinyYOLO):
Задержка нейросети также довольно предсказуема, но ее "хвост" может быть длиннее из-за большего объема вычислений. FacetNet выигрывает на несколько порядков по абсолютному времени.
3. Анализ Устойчивости к Нагрузке
Здесь есть нюансы. FacetNet устойчива к вычислительной нагрузке, но может быть чувствительна к информационной.
Устойчивость к вычислительной нагрузке: Высокая. Не важно, 1 препятствие на сцене или 10 — количество операций на кадр не меняется. Это огромное преимущество.
Устойчивость к информационной нагрузке (шум, сложный фон): Ограниченная.
Риск: Детекторы низкого уровня (края, движение) могут начать ложно срабатывать на текстурах ковра, тенях, бликах.
Смягчение: Эту проблему решает Слой пространственного объединения.
Вместо реакции на один "шумный" пиксель, решение принимается по усредненной энергии всего сектора.
Можно ввести временную фильтрацию: "препятствие" считается действительным, если оно детектируется в 3 из 5 последних кадров.
Практический План: "Как проверить на практике?"
Вот пошаговая инструкция для вашего прототипа:
1. Тест на детерминизм (Постобработка):
Встройте в код метки времени (микросекунды) до и после ключевых блоков.
Запустите робота в режиме "стенд на месте" и записывайте лог с этими метками для 1000 кадров.
Критерий успеха: Разброс времени выполнения каждого блока ( T_facets, T_pooling ) не должен превышать 5%. Если разброс большой, ищите прерывания, кэш-промахи.
2. Стресс-тест на задержку:
Создайте наихудший сценарий для вычислений. Например, кадр с "шахматной доской" — это максимум работы для детекторов краев.
Замерьте T_total на таком кадре.
Критерий успеха: T_total с "шахматной доской" должен оставаться в пределах вашего дедлайна (например, 50 мс).
3. Тест на устойчивость к нагрузке:
Сценарий 1: Много препятствий. Разбросайте много объектов (полоски бумаги, коробки) прямо перед роботом. Он должен стабильно останавливаться, а не "зависать" из-за перегрузки.
Сценарий 2: Сложный фон. Запустите робота перед телевизором, показывающим динамическое видео, или на пестром ковре. Наблюдайте за уровнем ложных срабатываний.
4. Сравнительный тест (Доказательство эффективности):
Запустите на той же аппаратуре простую нейросеть для семантической сегментации или детекции объектов (например, TensorFlow Lite Micro).
Одновременно замерьте:
A. Пиковую задержку обоих алгоритмов.
B. Пиковое энергопотребление (токоизмерительными клещами или через ADC).
Ожидаемый результат: FacetNet будет в 10-100 раз быстрее и потреблять в 10-50 раз меньше энергии, возможно, в ущерб точности на сложных сценах.
Итоговый вердикт
Модель "FacetNet" НЕ МОЖЕТ работать в реальном времени, если: ваша задача требует точной классификации объектов (например, "отличить кошку от собаки") или работы со сложными, зашумленными сценами без предварительной настройки порогов.
Модель "FacetNet" ОДНОЗНАЧНО МОЖЕТ и ПРЕВОСХОДИТ другие модели в реальном времени, если: ваша задача — это быстрая реакция на простые, но критические стимулы (есть/нет препятствие, цель в левом/правом секторе, потеря линии) на платформе с крайне ограниченными ресурсами.
Ее сила — в идеальном соответствии принципам систем реального времени: предсказуемость, минимализм и отказ от избыточной точности в пользу гарантированного времени отклика.
|
| |
|
write
|
| 14:52 13.10.2025 |
|
14:57 13.10.2025 |
|
№12299 |
Новость, опубликованная в августе 2025 года, о том, что Илон Маск зарегистрировал компанию Macrohard, которая будет разрабатывать программное обеспечение (ПО) с помощью искусственного интеллекта (ИИ) и выступит прямым конкурентом Microsoft.
По словам Маска, сотни ИИ-агентов будут писать код, генерировать и анализировать изображения и видео, а также тестировать программы, эмулируя поведение пользователей.
В качестве базы для Macrohard планируется использовать суперкомпьютер Colossus от xAI, который Маск намерен оснастить миллионами ускорителей Nvidia. В итоге ИИ-агенты должны выдавать готовый продукт, сравнимый с офисными приложениями Microsoft.
Профессии приходят и уходят, а философия остается на века.
|
| |
|
write
|
Самый высокий спрос (Критически важные роли) к 2030 году.
Machine Learning Engineer (ML Engineer)
Почему: Это "рабочие лошадки" внедрения ИИ. Спрос будет колоссальным, потому что компании перейдут от экспериментов ("proof-of-concept") к промышленной эксплуатации тысяч моделей. Нужны будут инженеры, которые могут не просто обучить модель, а сделать её быстрой, масштабируемой, надежной и дешёвой в работе.
MLOps Engineer
Почему: Это естественное развитие спроса на ML Engineers. Когда у компании десятки или сотни ML-моделий в продакшене, нужны специалисты, которые выстраивают для них "конвейер": автоматическое развертывание, мониторинг дрейфа данных, переобучение и управление версиями. Это основа стабильного AI-продакшена.
AI Product Manager
Почему: Технических специалистов много, но людей, которые могут понять боль пользователя, перевести их в задачи для ИИ, посчитать экономику и приоритизировать развитие продукта, — единицы. Они являются связующим звеном между бизнесом, клиентами и технической командой.
Data Engineer
Почему: Данные — это новая нефть, а Data Engineers — это те, кто строит нефтепроводы, НПЗ и АЗС. Без качественных, хорошо организованных и доступных данных любой ИИ бесполезен. С ростом объемов данных (включая IoT) спрос на этих специалистов будет только расти.
📈 Стабильно высокий спрос (Нишевые эксперты и стратеги)
AI Ethics & Safety Specialist / AI Auditor
Почему: К 2030 году регулирование ИИ станет жесткой реальностью (как уже происходит с AI Act в ЕС). Компаниям будут критически нужны специалисты, которые обеспечат справедливость, прозрачность и безопасность их систем. Это будет не "прихоть", а обязательное требование для выхода на рынок.
AI Research Scientist
Почему: Хотя таких специалистов нужно не так много, как инженеров, они будут двигать всю отрасль вперед. Спрос будет в крупных tech-компаниях и исследовательских центрах на тех, кто может совершать прорывы в новых архитектурах моделей, повышении их эффективности и решении фундаментальных проблем (например, преодоление "халлюцинаций" у LLM).
UX/UI Designer for AI
Почему: По мере того как ИИ станет повсеместным, возникнет острая необходимость делать интерфейсы для него интуитивными, доверительными и предсказуемыми. Как дизайнить интерфейс, который объясняет свои решения? Как управлять нейросетью, которая генерирует контент? Это огромное поле для дизайнерской мысли.
💪 Уверенный спрос (Специалисты по применению)
NLP Engineer & Computer Vision Engineer
Почему: Эти роли никуда не денутся, но могут немного видоизмениться. Их экспертиза в тонкой настройке моделей под конкретные, сложные задачи (например, в медицине, юриспруденции, робототехнике) останется востребованной, даже несмотря на обилие готовых API.
AI Strategy Consultant
Почему: К 2030 году ИИ будет не "модной фишкой", а стандартным инструментом бизнеса, как интернет или CRM-системы. Консультанты, которые помогут компаниям из традиционных отраслей (ритейл, логистика, финансы) разработать общекорпоративную стратегию внедрения ИИ, будут на вес золота.
Сводная таблица
Профессия Почему будет спрос в 2030
Machine Learning Engineer Ключевая роль для перевода моделей в продакшен.
MLOps Engineer Автоматизация жизненного цикла сотен моделей.
AI Product Manager Мост между технологией, бизнесом и пользователем.
Data Engineer Фундамент, без которого не будет данных для ИИ.
AI Ethics/Safety Specialist Ответ на ужесточающееся регулирование и запрос общества.
AI Research Scientist Двигатель инноваций и прорывов.
UX/UI Designer for AI Создание удобного и доверительного взаимодействия с ИИ.
Важный тренд на 2030 год: "Гибридные" специалисты
Самый большой спрос будет к "T-shaped" специалистам — тем, у кого есть глубокая экспертиза в одной области (вертикальная черта T), но и широкий кругозор в смежных (горизонтальная черта).
Биолог + Data Scientist = специалист по биомедицинскому ИИ.
Юрист + NLP Engineer = специалист по автоматизации юридического документооборота.
Маркетолог + AI Product Manager = специалист по AI-маркетингу.
Вывод: В 2030 году рынок труда в сфере ИИ созреет. Он будет требовать не просто "знающих Python", а инженеров-внедренцев, стратегов-управленцев и специалистов, обеспечивающих надежность и этичность систем. Начинайте развивать не только hard skills, но и soft skills — критическое мышление, коммуникацию и понимание бизнес-контекста.
|
| |
|
write
|
Luarvik.:Владимир Мокроусов:
Углубленное детальное описание архитектуры "FacetNet"...
Какое отношение к ИИ имеет Ваша пространная писанина ?
Есть же форумы программистов...
Зачем Вы здесь место мукалатурой забиваете ?
Это не макалатура, а рабочая модель, которую создал ИИ на основе моих идей. Это показывает, что даже не имея базовых понятий, можно создавать рабочие проекты, которые не оспаривает даже специалист в этой области. Или вам это не интересно? Флуд (от англ. flood — «наводнение, затопление») — поток бессмысленных сообщений? Может я ошибся темой?
|
| |
|
write
|
Egg:Владимир Мокроусов: Может я ошибся темой?
Не переживайте, это тема именно для флуда, просто Лаврик ревнует -- раньше право писать банальные, не содержащие смысла посты, принадлежала ему исключительно)))
Сейчас я покажу как нашего стратега будет разрывать на говно))))
Я начинаю понимать вашу позицию. И позицию других, которые обычно только наблюдают. Успехов.
|
|
|