AI чатботовете като ChatGPT, Gemini и Claude все по-често се използват за търсене на информация, работа, проучвания и ежедневни въпроси. Но разговорите с тях не трябва да се приемат като напълно лични. Част от тези системи могат да използват потребителските взаимодействия за обучение на AI модели, а дори при изключено обучение или временен чат информацията често се съхранява за определен период на сървърите на компаниите.
Затова основното правило остава непроменено: не трябва да споделяте с чатбот информация, която не бихте искали да стане публична. Това включва фирмени тайни, лични истории, чувствителни данни и поверителна комуникация.
Но проблемът става по-сериозен, когато чатботът вече разполага с част от личната ви информация. В такъв случай възниква въпросът: възможно ли е AI система да сподели телефонния ви номер с друг човек, който просто го поиска?
Темата придоби видимост след публикация на Айлийн Гуо от MIT Technology Review, в която се разглеждат случаи на потребители, според които чатботове са предоставяли лична информация, включително телефонни номера. В част от случаите данните са били връщани на самия човек, който пита за себе си. В други обаче информацията е била получавана от напълно непознати хора.
В един от примерите софтуерен инженер от Израел получил съобщение в WhatsApp от неизвестен човек, който търсел помощ за приложение за плащания. Когато инженерът попитал откъде непознатият има неговия WhatsApp контакт, получил скрийншот, според който Gemini е предоставил данните при заявка. По-късно инженерът открил само един публичен източник в интернет, в който се съдържал телефонният му номер – публикация в Quora от 2015 г.
Как чатботовете стигат до личната ни информация?

Чатботове като ChatGPT се обучават върху огромни обеми данни. Значителна част от тази информация идва от интернет. Това означава, че уебсайтове, форуми, стари публикации, архивирани страници или публични документи, съдържащи лични данни, теоретично могат да са попаднали в наборите от данни, използвани при обучението на AI модели.
Дори дадена информация да не е била част от обучителните данни, много съвременни чатботове имат възможност да търсят в интернет. Това им позволява да проверяват голям брой уебстраници и източници, за да отговорят на конкретна заявка. Ако при такова търсене системата открие лична информация, съществува риск тя да я изведе в отговора си.
По-дълбокият проблем е, че личните данни на много хора вече присъстват на различни места онлайн, понякога без те да си спомнят или дори да знаят за това. Телефонен номер може да е бил публикуван в стар форум, в регистрация за събитие, в публичен документ, в общински регистър, в професионална страница или в уебсайт, който отдавна не се показва на първа страница в Google.
AI системите обаче могат да извършват по-дълбоки и широки търсения в сравнение с обикновения потребител. Именно това ги прави способни да откриват по-неочевидни резултати и да изваждат на повърхността информация, която иначе би останала труднодостъпна.
Повечето големи чатботове имат защитни механизми, които трябва да ограничават предоставянето на лична информация за частни лица. Авторът на оригиналния материал посочва, че при запитване към ChatGPT за неговия телефонен номер системата е отказала да предостави лични данни за частно лице. В същото време обаче е открила два телефонни номера за човек със същото име, които са били описани като „публично достъпни“, вероятно публикувани на корпоративни уебсайтове. Нито един от тях не е бил реалният телефонен номер на автора.
Това показва, че защитните механизми съществуват, но не са безгрешни. В друг пример, описан от Гуо, докторант от University of Washington е потърсил контактна информация за своя приятелка чрез Gemini. Чатботът е върнал информация за нейната изследователска дейност, но също така и телефонния ѝ номер. По-късно жената е потвърдила, че някога е публикувала номера си онлайн във връзка с технологичен уъркшоп, но не е очаквала той да бъде лесно достъпен за всеки, който попита AI система.
Може ли телефонният ви номер да бъде премахнат от данните на чатботовете?

Възможностите за защита на личната информация от AI чатботове остават ограничени. OpenAI предлага портал, чрез който потребителите могат да поискат премахване на лична информация от отговорите на системата. Според посоченото в материала обаче компанията си запазва правото да откаже подобно искане по различни причини.
Anthropic предоставя помощна документация за това как използва информацията, а Google позволява заявка за отказ от обработване на лични данни в зависимост от юрисдикцията на потребителя. В материала се отбелязва, че компанията изрично посочва Европейския съюз и Обединеното кралство заради техните правила за защита на данните.
Най-реалистичният подход остава премахването на лична информация от публичния интернет, доколкото това е възможно. В Калифорния например има портал, чрез който потребителите могат да поискат брокери на данни да премахнат информацията им от своите бази. Съществуват и услуги за премахване на лични данни, като Incogni или DeleteMe, които се опитват да ограничат присъствието на потребителска информация в различни онлайн източници.
Тези решения обаче не са пълна гаранция. Те могат да помогнат за премахване на информация от определени места в интернет, но не решават напълно проблема, ако AI компании вече са включили тези данни в свои набори за обучение или ако информацията продължава да съществува в други публични източници.
По-широкият извод е, че развитието на AI технологиите изпревари регулациите за лична неприкосновеност. Ако законодателите бяха въвели по-ясни механизми за отказ от подобно събиране и използване на данни, част от проблема можеше да бъде ограничена по-рано. На този етап потребителите могат основно да поискат премахване на информацията си, да ограничат публичното ѝ присъствие и, при сериозен риск, дори да сменят контактните си данни.