HomeТехнологијаChatGPT, Gemini, DeepSeek… која вештачка интелигенција халуцинира најмногу?

ChatGPT, Gemini, DeepSeek… која вештачка интелигенција халуцинира најмногу?

- Advertisement -spot_img

Чет-ботовите со вештачка интелигенција не се совршени и повремено можат да „халуцинираат“ или да дадат неточни одговори – кој води во ова?

Големите јазични модели работат со препознавање на шеми и предвидување на следниот најверојатен збор во низа, а не со всушност „познавање“ на фактите.

Проблемот се јавува кога моделот не може да најде јасен образец за одговор, но сепак се обидува да состави значаен текст врз основа на статистика, што може да доведе до неточни информации.

Legal Guardian Digital, компанија за SEO оптимизација за правна фирма, ги анализираше стапките на грешки на овие алатки, задоволството на корисниците и стабилноста на различните чет-ботови.

Резултатите покажуваат дека Google Gemini има највисока стапка на неточни одговори, со дури 32% „халуцинации“. Следен е ChatGPT со околу 30%, додека Perplexity AI е најточен, со околу 13% неточни одговори. DeepSeek и Grok исто така бележат релативно ниски стапки на грешки од 14% и 15%.

Во однос на целокупното корисничко искуство, DeepSeek и ChatGPT имаат највисоки оценки за задоволство од 4,7 (од максимум 5), додека Perplexity AI следи со 4,6.

Во конечната ранг-листа, која ги вклучува сите фактори, Perplexity AI го зазема првото место со индекс од 85, по што следат Grok и DeepSeek. ChatGPT е во средината на листата со оценка од 50, додека Gemini постигнува 41, а Meta AI го зазема последното место со 37 поени.

- Advertisement -spot_img
- Advertisement -spot_img
- Advertisement -spot_img
Најчитани
- Advertisement -spot_img
Stay Connected
10,404FansLike
61,453SubscribersSubscribe
- Advertisement -spot_img
Поврзани вести
- Advertisement -spot_img