Най-новите инструменти за изкуствен интелект, създадени с цел да бъдат по-интелигентни, допускат повече фактически грешки от по-старите версии. Както подчертава The New York Times, тестовете показват, че при усъвършенстваните системи на компании като OpenAI грешките достигат 79%. Това може да създаде проблеми за маркетолозите, които разчитат на тези инструменти за съдържание и обслужване на клиенти.
Нарастващ брой грешки в усъвършенстваните системи с изкуствен интелект
Последните тестове разкриват тенденция: по-новите системи с изкуствен интелект са по-малко точни от своите предшественици. Най-новата система на OpenAI, o3, греши в 33% от случаите, когато отговаря на въпроси за хора. Това е два пъти повече, отколкото при предишната им система. Нейният модел o4-mini се представи още по-зле – 48% грешки при същия тест.
При общите въпроси резултатите (PDF връзка) бяха следните:
- o3 на OpenAI греши в 51% от случаите
- Моделът o4-mini греши в 79% от случаите
Подобни проблеми се появяват в системите на Google и DeepSeek. Амр Авадала, главен изпълнителен директор на Vectara и бивш ръководител на Google, казва пред The New York Times:
„Въпреки нашите усилия, те винаги ще халюцинират. Това никога няма да изчезне.“
Последици за бизнеса в реалния свят
Това не са просто абстрактни проблеми. Реалните предприятия са изправени пред негативни реакции, когато ИИ дава грешна информация. Миналия месец Cursor (инструмент за програмисти) се сблъска с гневни клиенти, когато неговият бот за поддръжка с изкуствен интелект погрешно заяви, че потребителите не могат да използват софтуера на няколко компютъра. Това не беше вярно. Грешката доведе до анулиране на акаунти и публични оплаквания.
Главният изпълнителен директор на Cursor, Майкъл Труел, трябваше да се намеси:
„Ние нямаме такава политика. Разбира се, вие сте свободни да използвате Cursor на няколко машини.“
Защо надеждността намалява
Защо по-новите системи за изкуствен интелект са по-малко точни? Според доклад на New York Times отговорът се крие в начина, по който са създадени. Компании като OpenAI са използвали повечето от наличните текстове в интернет за обучение. Сега те използват „обучение с подсилване“, което включва обучение на ИИ чрез проби и грешки. Този подход помага при математиката и кодирането, но изглежда вреди на фактическата точност.
Изследователят Лаура Перес-Белтрачини обяснява:
„Начинът, по който тези системи са обучени, ги кара да се фокусират върху една задача – и да забравят за другите.“
Друг проблем е, че по-новите модели с изкуствен интелект „мислят“ стъпка по стъпка, преди да отговорят. Всяка стъпка създава нова възможност за грешки. Тези констатации са притеснителни за маркетолозите, които използват ИИ за съдържание, обслужване на клиенти и анализ на данни. Съдържание с ИИ, съдържащо фактически грешки, може да навреди на класирането ви при търсене и на марката ви.
Пратик Верма, главен изпълнителен директор на Okahu, казва пред New York Times:
„Прекарвате много време в опити да разберете кои отговори са фактологични и кои не. Ако не се справите правилно с тези грешки, това на практика елиминира стойността на системите с изкуствен интелект.“
Защита на маркетинговите ви операции
Ето как да защитите маркетинга си:
- Направете преглед от хора на цялото съдържание с изкуствен интелект, насочено към клиентите
- Създайте процеси за проверка на фактите за материали, генерирани от изкуствен интелект
- Използвайте изкуствен интелект по-скоро за структура и идеи, отколкото за факти
- Обмислете инструменти за изкуствен интелект, които цитират източници (т.нар. поколение с разширено извличане)
- Създайте ясни стъпки, които да следвате, когато забележите съмнителна информация от изкуствен интелект
Пътят напред
Изследователите работят по тези проблеми, свързани с точността. OpenAI казва, че „активно работи за намаляване на по-високите нива на халюцинации“ в по-новите си модели. Маркетинговите екипи се нуждаят от собствени предпазни мерки, докато все още използват предимствата на ИИ. Компаниите със силни процеси на проверка ще балансират по-добре ефективността на ИИ с необходимостта от точност. Намирането на този баланс между бързина и коректност ще остане едно от най-големите предизвикателства пред цифровия маркетинг, тъй като ИИ продължава да се развива.