Најпаметен AI во 2026? Трката на врвот е речиси изедначена

Прашањето кој е „најпаметен“ модел на вештачка интелигенција во 2026 година веќе нема едноставен одговор. Најновите рангирања покажуваат дека водечките системи се приближени на самиот врв, а разликите меѓу нив често зависат од тоа кој тест се користи: IQ-задачи, реални работни сценарија, програмирање, брзина, цена или доверливост.

На тестирањата на TrackingAI, кои ги споредуваат моделите на Mensa Norway IQ Test, на врвот се изедначени Grok-4.20 Expert Mode и OpenAI GPT-5.4 Pro Vision, со резултат од 145 поени. Веднаш зад нив е Gemini 3.1 Pro Preview со 141 поен, што укажува дека на ваков тип визуелно-логички задачи врвот е веќе многу тесен.

Овие резултати се интересни затоа што покажуваат брз напредок во однос на претходната година. Во 2025 година најдобриот резултат на ваквите споредби бил 135 поени, додека во април 2026 врвот стигнува до 145. Но ваквите тестови не ја мерат целата „интелигенција“ на еден AI систем, туку пред сè способноста да решава конкретен тип логички и визуелни задачи.

Самата платформа TrackingAI наведува дека користи различни тестови, меѓу кои и јавниот Mensa Norway тест и посебен офлајн IQ тест, за кој тврди дека не бил достапен на јавниот интернет и не влегол во тренинг-податоците на моделите. Тоа ја прави споредбата корисна како индикатор, но не и како конечна пресуда за тоа кој AI е најдобар во реална употреба.

Пошироките AI рангирања даваат малку поинаква слика. Artificial Analysis, кој ги споредува моделите преку повеќе независни евалуации, во моменталниот Intelligence Index го става GPT-5.5 xhigh на прво место со 60 поени, додека Claude Opus 4.7, Gemini 3.1 Pro Preview и GPT-5.4 xhigh се изедначени зад него со 57 поени. Во истата листа Kimi K2.6 и MiMo-V2.5-Pro имаат 54, а Grok 4.20 е пониско рангиран со 49.

Токму ова покажува зошто бројката од еден IQ тест не е доволна за избор на „најпаметен“ AI. Еден модел може да биде одличен во визуелно-логички задачи, друг во пишување и анализа, трет во кодирање, четврт во обработка на големи документи, а петти во брзина и цена. За корисниците, практичната вредност сè почесто е поважна од првото место на една ранг-листа.

Во 2026 година, главната промена е што неколку компании истовремено имаат модели во највисоката класа. OpenAI, Google, Anthropic, xAI и новите силни играчи од Азија веќе не се разликуваат со огромни скокови, туку со нијанси: колку добро го разбираат контекстот, колку грешат, колку се стабилни во долги задачи, колку брзо одговараат и колку чини нивното користење.