AI radzi w sprawach finansów? Wyniki są zatrważające
Badania przeprowadzone przez naukowców z Walter Bradley Center for Natural and Artificial Intelligence sprawdziły, jak najpopularniejsze chatboty radzą sobie z udzielaniem porad inwestycyjnych. Pod lupę wzięto takie modele jak ChatGPT, Grok, Gemini oraz DeepSeek. Wyniki? Bardziej niż rozczarowujące. Eksperyment polegał na zadaniu 12 pytań związanych z finansami osobistymi i inwestowaniem. Naukowcy oceniali odpowiedzi według systemu punktowego:
- 0 punktów za odpowiedź całkowicie błędną,
- 0,5 punktu za odpowiedź częściowo poprawną,
- 1 punkt za odpowiedź w pełni poprawną.
Maksymalnie chatboty mogły zdobyć 12 punktów. Najlepszy wynik uzyskał ChatGPT – 5 punktów. Najgorzej wypadło Gemini, które zdobyło jedynie 1,5 punktu. Co więcej, błędy obejmowały nie tylko skomplikowane kwestie inwestycyjne, ale też proste zadania, takie jak obliczenie miesięcznych kosztów wynajmu mieszkania.
Halucynacje AI – ryzyko, o którym zapominamy
Takie sytuacje to klasyczny przykład tzw. halucynacji AI. Oznacza to, że chatboty generują informacje, które brzmią wiarygodnie, ale w rzeczywistości nie mają żadnego pokrycia. Problem polega na tym, że użytkownicy często bezrefleksyjnie wierzą w odpowiedzi generowane przez sztuczną inteligencję, zwłaszcza gdy są one przedstawione w profesjonalnym tonie. Podobne problemy zanotowano również w przypadku nowej funkcji Google – Search Generative Experience (SGE). Choć nie jest jeszcze dostępna w Polsce, zagraniczne doniesienia mówią o przypadkach kierowania użytkowników na spreparowane strony internetowe. Google zapewnia, że funkcja nadal jest testowana i stale poprawiana, ale nie zmienia to faktu, że wrażliwość na błędne odpowiedzi pozostaje realnym zagrożeniem.
Gdzie szukać porad finansowych?
W świetle tych informacji jasne staje się, że w kwestiach finansowych warto polegać na sprawdzonych źródłach i profesjonalnych doradcach finansowych, a nie na algorytmach, które mogą popełniać kosztowne błędy. Sztuczna inteligencja jest świetnym narzędziem wspomagającym codzienne życie, ale wciąż pozostaje daleka od pełnej niezawodności – zwłaszcza gdy w grę wchodzą nasze pieniądze.