| |
Решатель ARC-задач Франсуа Шолле | |
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
| 19:07 08.02.2026 |
|
19:07 08.02.2026 |
|
№13569 |
Gray Tag:Вышел новый Claude, Opus 4.6, решает ARC AGI 2 с качеством 68.8%
Понимаю, ув. mserg опять бесноваться и кричать, что всё написано руками))
Написано, может быть, было и руками, а вот обдумана новая моделька была точно умной головой)))
https://www.anthropic.com/news/claude-opus-4-6
Никогда не было, и вот опять! И вообще, я миллион раз уже говорил, не надо преувеличивать!
В действительности могу повторить все то же. Нужна независимая проверка, которая делается Шолле и ко. и публикуется на https://arcprize.org/
Пока там самый умный GPT. Как появится на сайте опус с 68.8%, тогда признаем успех. А пока нет.
|
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
Gray Tag:mserg: В действительности могу повторить все то же.
Именно об этом я и говорю, ты уже четыре года повторяешь одно и то же, а тем временем ARC-1 решена полностью, а ARC-2 на 70%, что уже выше человеческого результата)))
Цитату можно было отрезать и получше.
У Лукашенко можно поучиться:
Как из маминой из спальни
Кривоногий и хромой
Выбегает...
Так вот, выбегает Egg, и рассказывает про людей с 70%. Но это, скорее, уровень неглупой гориллы - Шолле для людей говорил о 85%. Что у вас там в Америке случилось с людьми?
И прогресс связан не чисто с LLM ...
А, ладно, пишите еще.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
Любую задачу(например Шоле) можно решить на машине тьюринга, или рекурентной нейросети, но также можно всё сделать с помощью базы данных, но она может быть велика, однако решение универсальное.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
| 16:06 24.02.2026 |
|
22:22 24.02.2026 |
|
№13649 |
Что там у людей по мнению Шолле? 85%? Конфлюэнс сделал 97.9%, код выложен, его можно воспроизвести. Настоящие задачи на интеллект начнутся тогда, когда их будут придумывать не шолли, а LL-модели)))
Confluence Labs выходит из режима скрытой разработки с результатом SOTA на ARC-AGI-2 , получив оценку 97,9% при стоимости 11,77 долларов за задачу в публичной оценке. Вот как мы этого добились, почему это важно и что нас ждет дальше:
https://github.com/confluence-labs/arc-agi-2
|
|
|