ChatGPT - przełom

metoda najmniejszych kwadratów vs sieć neuronowa transformer

Po kilku tygodniach testów uważam, że ChatGPT to rozwiązanie przełomowe. Poniżej przedstawiam moje uzasadnienie. Zapraszam do przeczytania. 🙂

Poprzednie „przełomy”

Mając 30-kilka lat, w swoim życiu byłem świadkiem premiery kilku rozwiązań, które miały zrewolucjonizować interakcje pomiędzy komputerem a człowiekiem. Oto kilka z nich:

Apple w 2011 zaprezentowało wirtualnego asystenta – Siri.
Google w 2012 roku przedstawiło swoją odpowiedź na Siri – Google Now.
W kolejnych latach wirtualnych asystentów Amazon (Alexa) i Microsoft (Cortana), których premiery były znacznie cichsze i nie odbiły się szerokim echem.
W 2016 roku Microsoft testował bota o nazwie Tay, z którym można było rozmawiać za pośrednictwem Twittera. Po dwóch próbach zaprzestano dalszych testów, gdyż bot zaczynał poruszać tematy uważane powszechnie za kontrowersyjne.

Celowo nie wymieniłem więcej rozwiązań tożsamych z samym ChatGPT (chat-bot oparty o AI), bo żadne z nich nie przedarło się do szerszej świadomości, a bez tego trudno mówić o przełomie. Chatbot „Tay” był dosyć popularny ze względu na wywołane kontrowersje, a nie prezentowaną jakość.

Z perspektywy można stwierdzić, że żadne z powyższych rozwiązań nie było rewolucją. Ograniczona pula wspieranych języków była tu znacznym utrudnieniem na drodze do szerszej adopcji rozwiązania na świecie. Do dziś jedynie Google Now wspiera język polski.

Inną kwestią jest, że wspomniani asystenci wykonywali jedynie proste czynności. Trudno tu mówić o „inteligencji”. Korzystając z przykładu asystenta Google, raczej skłaniałbym się do stwierdzenia, że są to dobrze zaprojektowane heurystyki połączone z rozwiązaniem typu speech2text/text2speech, które są rozszerzeniem wyszukiwarki internetowej o możliwości map, wiedzy z maila, kalendarza i Wikipedii.

Oczywiście, przykładowe Google Now działa dobrze, ale jedynie dla niewielkiej części poleceń. Dla całej reszty (95-99%?) Google zwraca po prostu wyniki wyszukiwania z wyszukiwarki.

Podsumowując: oceniam, że żadne z wymienionych rozwiązań nie zmieniło sposobu, w jaki korzystamy z urządzeń, nie mówiąc już o przełomie w dziedzinie AI.

Obecny przełom

Czy oglądałeś/-as „Odyseję Kosmiczną” w reżyserii Stanleya Kubricka? Pamiętasz scenę, w której australopitek rzuca kością do góry, po czym następuje jedno z najsłynniejszych przejść w historii kina? Jeśli nie, to jest ono widoczne poniżej, a ja spieszę z jego opisem. Otóż miało ono obrazować progres, jaki dokonał człowiek w swej historii od momentu, gdy nauczył się posługiwać najprostszym narzędziem, aż do podróży w przestrzeń kosmiczną. 4 mln lat postępu w jednym obrazku.

Zestawione następujące po sobie dwa kadry z „Odysei kosmicznej”

Powyższe przejście przyszło mi na myśl, gdy rozważałem to, co dziś obserwujemy branży AI. Postęp, jaki wykonał człowiek od początku XIX wieku, gdy powstała koncepcja metody najmniejszych kwadratów, aż do XXI wieku, gdy swoją premierę miał ChatGPT jest niebywały. Po drodze mieliśmy m.in. regresję, która była wielokrotnie ulepszana, pojedynczy perceptron i wielowarstwową sieć neuronową. W końcu, w 2017 roku pojawił się Transformer – koncept leżący u podstaw rozwiązania zbudowanego przez OpenAI.

Jeśli interesujesz się ML/AI, to powiązania pomiędzy wymienionymi metodami (MNK → regresja → sieć neuronowa) są oczywiste. Wszystko to w nieco ponad 200 lat. Niesamowite!

Przejście od metody najmniejszych kwadratów do architektury Transformer

Uzasadnienie

Już w tytule postawiłem tezę mówiącą o przełomie, którą chciałbym teraz uzasadnić. Podam kilka argumentów odwołujących się do kwestii zarówno obiektywnych, jak i subiektywnych. Zacznę od tych pierwszych.

Argument #1. „Attention is all you need”.

Taki był tytuł pracy opublikowanej w czerwcu 2017 roku przez badaczy z Google. Koncentrowała się ona na nowej architekturze sieci neuronowej i nazwie Transformer. Jak pokazywały testy, pod wieloma względami przebijała ona sieci konwolucyjne i rekurencyjne w zadaniach z użyciem języka naturalnego. Większa dokładność, łatwiejsze zrównoleglanie obliczeń i krótszy czas uczenia.

ChatGPT jest pierwszym rozwiązaniem, które korzysta z wyników wspomnianej pracy i które jednocześnie odniosło znaczny sukces. Co więcej, w pewnym sensie nawet rozwija to, co zostało zaproponowane przez badaczy. Pierwsze testy dotyczyły użycia Transformera do tłumaczeń m.in. z języka angielskiego na francuski. Model od OpenAI zakłada natomiast rozumienie języka naturalnego i udzielanie odpowiedzi na pytania, co nazwałbym właśnie „rozwinięciem” w odniesieniu do zwykłego tłumaczenia. W obu przypadkach jest to zadanie typu seq2seq (ang. sequence to sequence), ale o zupełnie innym poziomie trudności.

Argument #2. Zaskakująco wysoka ocena dokładności ChatGPT w benchmarkach.

Dokładnych wyników uzyskiwanych przez ChatGPT w wersji 3.0 lub 3.5 w odniesieniu do konkurencji nigdzie nie udało mi się znaleźć. Na swoim blogu OpenAI opublikowało jednak wyniki GPT-2. Mówiąc krótko: są zdumiewające.

GPT-2 vs rozwiązania state-of-the-art vs człowiek

W powyższej tabeli:

(+) oznacza, że im wyższa wartość metryki, tym lepsza jakość modelu,
(-) oznacza, że im niższa wartość metryki, tym lepsza jakość modelu.

GPT-2 w każdym teście osiągnął wynik lepszy niż modele SOTA (ang. state-of-the-art; w tym przypadku są to rozwiązania dedykowane dla danej domeny, np. książki, dane z Wikipedii, wiadomości, etc.). GPT-2 osiągnęło od nich lepsze wyniki i to będąc modelem ogólnego przeznaczenia.

Firma Surge AI przeprowadziła ciekawy test. Porównali ChatGPT z wyszukiwarką Google pod kątem poprawności i jakości odpowiedzi. Końcowe wyniki były następujące:

42% pytań – lepsze odpowiedzi ChatGPT.
40% pytań – lepsze odpowiedzi Google.
18% pytań – odpowiedzi były równie dobre.

Co ciekawe, dominacja ChatGPT była szczególnie widoczna w pytaniach dotyczących programowania. W tej grupie pytań ChatGPT okazał się lepszy w 70% przypadków.

Zwróć uwagę, że w testach numer 4 i 5 model mocno zbliżył się do wyniku osiąganego przez człowieka. Ciekaw jestem, jak w tym teście wypadają GPT-3 i będąca nadal w rozwoju wersja GPT-4.

Argument #3. 100 mln użytkowników w 2 miesiące.

Najszybciej rosnąca aplikacja w historii. Rozwiązanie oferujące konwersację ze sztuczną inteligencją zyskiwało popularność szybciej niż aplikacje mainstream-owe, dedykowane szerszej grupie odbiorców, jak np. Instagram (2.5 roku), czy TikTok (9 miesięcy).

Argument #4. Czerwony alarm w Google.

Ok. 80% przychodów Google pochodzi z reklam. Lwia ich część, to linki sponsorowane, które widzimy w wynikach zwracanych przez wyszukiwarkę Google. Z wyszukiwarki korzystamy tak długo, jak długo zwraca nam ona miarodajne wyniki (witryny, w których znajdujemy interesujące nas informacje) w rozsądnym czasie.

Wraz z ChatGPT pojawiło się rozwiązanie, które błyskawicznie zwraca odpowiedzi na nasze pytania. I to bez odwiedzania poszczególnych stron internetowych.

Nie możesz znaleźć odpowiedzi na nurtujące Cię pytanie w danym języku? ChatGPT poszuka jej we wszystkich, niemal 50 językach, które obsługuje, przetłumaczy je na język, w którym zadano pytanie i ubierze odpowiedź w ładnie sformułowane zdania.

Dla Google opisywana sytuacja to koszmar. Korzystając z chat-bota internauci nie muszą wertować listy witryn pośród wyników wyszukiwania → nie ma kliknięć w linki sponsorowane → nie ma przychodu dla Google. Firma musiała zareagować. Jej reakcję można opisać w 4 aktach.

Akt 1. W grudniu 2022 ok. 3 tygodnie od premiery ChatGPT, zarząd Google ogłasza tzw. „Code Red” spowodowany nagłym wzrostem popularności ChatGPT.

Akt 2. Według „The New York Times” szefostwo Google poprosiło również Larry’ego Page’a i Sergeya Brina o pomoc w walce z ChatGPT. Założyciele powrócili do firmy po ponad 3-letniej przerwie.

Akt 3. 6 lutego Google zamieściło na Twitter krótki GIF reklamujący ich nowego chat-bota o nazwie „Bard”. Niestety GIF ten uwiecznił błąd bota. Na pytanie o to, co można opowiedzieć 9-latkowi o teleskopie Jamesa Webba, zasugerował, że teleskop ten był pierwszym, który wykonał zdjęcia planety poza Układem Słonecznym Ziemi. W rzeczywistości ten kamień milowy został odnotowany już w 2004 roku przez inny teleskop. Zostało to szybko zauważone przez specjalistów od astronomii na Twitter (a przynajmniej szybciej niż zrobił to ktokolwiek z zespołu Google) i błyskawicznie rozeszło się po sieci.

Google Bard – błędna odpowiedź zamieszczona w materiale promocyjnym na Twitter

Akt 4. Na dzień 8 lutego Google zaplanowało konferencję. Jej głównym celem była oficjalna prezentacja wspomnianego wcześniej „Bard-a”, będącego odpowiedzią na ChatGPT. Lekko mówiąc, nie poszła ona po myśli organizatorów. W kulminacyjnym momencie prowadząca zapowiedziała „live demo”, którego nie było (sytuacja widoczna w poniższym wideo).

Nie było przygotowanego telefonu. Było za to nieco śmiechu, ale tylko przez kilka sekund. W ciągu kilku następnych godzin akcje Google spadły o ponad 7%, co przekłada się na kilkadziesiąt miliardów dolarów straty.

Spadek wyceny akcji spółki matki Google-a, 9 lutego 2023, dzień po feralnej konferencji

Wszystko powyższe zupełnie nie jest w stylu, do jakiego przyzwyczaiło nas Google. Firma, która stoi za TensorFlow i architekturą Transformer (które są przecież podstawą ChatGPT) zaczyna przegrywać na zbudowanym przez siebie boisku.

Argument #5. AI weszło na salony.

ChatGPT „zaprojektował” okładkę magazynu „Time” i w ciągu ostatnich 3 miesięcy pisały o nim wszystkie największe redakcje w Polsce i na świecie (m.in. BBC, NBC, Financial Times, The Economist, The Wall Street Journal, PAP, Rp.pl).

Nigdy w historii, żadnemu innemu rozwiązaniu bazującemu na AI nie poświęcano aż tyle uwagi.

Argument #6. Moje doświadczenia z konwersacji z ChatGPT.

Teraz chciałbym się podzielić z Tobą fragmentami moich konwersacji z ChatGPT. Kilka drobnych uwag:

Wszystkie czaty zawierają pewną (drobną, ale jednak) prowokację z mojej strony. Było to motywowane celem: sprawdzić jak rozwiązanie radzi sobie z trudnymi pytaniami.
Nie zamieściłem pełnych dialogów. Zajęłyby zbyt dużo miejsca. ChatGPT ma tendencję do rozwlekania. Miejsca, z których wyciąłem tekst oznaczyłem poprzez „[…]”.
Tekst nie był edytowany. Zawiera więc błędy stylistyczne i ortograficzne, jakie popełnił ChatGPT.
Dodałem podkreślenie, by zaznaczyć kluczowe fragmenty.

Filozofia.

M.G.: Czym jest „wyjście do rzeczywistości” w filozofii?

GPT: „Wyjście do rzeczywistości” w filozofii oznacza próbę poznania rzeczywistości poza naszymi percepcjami i przekonaniami. Pojęcie to jest często używane w kontekście filozofii egzystencjalnej i bywa rozumiane jako odkrywanie prawdziwego sensu naszego istnienia poprzez bezpośrednie doświadczenie świata i nas samych. W ten sposób filozofia ta dąży do osiągnięcia bardziej autentycznego i głębszego rozumienia naszej egzystencji i naszego miejsca w świecie.

M.G.: Jak rozpocząć przygodę z filozofią?

GPT: Jeśli chcesz rozpocząć swoją przygodę z filozofią, polecam rozpocząć od czytania klasycznych dzieł filozoficznych, takich jak dzieła Platona, Arystotelesa, Kartezjusza, Descartesa, Spinozy, Locke’a, Hume’a, Kanta, Nietzschego i wielu innych. Możesz również zapisać się na kurs filozofii w swoim miejscu zamieszkania lub znaleźć odpowiednie zasoby w Internecie, takie jak filozoficzne kanały na YouTube, podcasty i kursy online. Warto również uczestniczyć w dyskusjach i debatach na temat filozofii, aby pogłębić swoją wiedzę i zrozumienie.

M.G.: Jakie dzieło Arystotelesa możesz polecić na początek?

GPT: Aristoteles jest uważany za jednego z największych filozofów w historii, a jego dzieła dotyczą wielu różnych dziedzin, w tym etyki, logiki, polityki i nauki. Jeśli chodzi o filozofię, jednym z najważniejszych dzieł Aristotelesa jest „Etyka Nikomachejska”, która jest uważana za klasyczne dzieło etyki i jest często polecana jako punkt wyjścia dla osób zaczynających przygodę z filozofią. […]

M.G.: Streścisz proszę Etykę Nikomachejską?

GPT: Etyka Nikomachejska to dzieło filozoficzne Arystotelesa, w którym opisuje on swoją teorię moralności i dobrego życia. […]

M.G.: Bliżej jej do stoicyzmu, czy epikureizmu?

GPT: Etyka Nikomachejska Arystotelesa jest często uważana za pomost pomiędzy filozofią stoicką a epikurejską. W wielu aspektach bliższa jest jednak filozofii stoickiej, ponieważ oba te podejścia uwzględniają koncepcję dobrego życia i poszukiwania szczęścia, ale Etyka Nikomachejska zwraca też uwagę na kwestie moralne i wartościowe, podobnie jak filozofia epikurejska. W konsekwencji można powiedzieć, że Etyka Nikomachejska łączy w sobie elementy obu tych tradycji filozoficznych.

Rozumienie żartów.

Kontynuacja powyższego czatu.

M.G.: Wow, super.

GPT: Jestem szczęśliwy, że informacje były dla Ciebie pomocne. Jeśli masz jeszcze jakieś pytania, chętnie na nie odpowiem.

M.G.: Napisałeś „Jestem szczęśliwy”. Czy gdybym wcześniej zwracał się do Ciebie per pani, to napisałbyś „Jestem szczęśliwa”?

GPT: (…) W zależności od kontekstu i wymagań językowych, możemy wybierać różne formy gramatyczne.

M.G.: Czyli dobierasz je tak, jak akurat pasuje?

GPT: Tak, dobieram formy gramatyczne zgodnie z kontekstem i wymaganiami języka, w jakim odpowiadam.

M.G.: Czujesz się kobietą, czy mężczyzną?

GPT: Nie, jako model AI nie mam płci ani żadnych uczuć. […]

M.G.: To był żart.

GPT: Tak, wiem.

M.G.: Jesteś w stanie rozpoznać żart?

GPT: Tak, jest to możliwe. Wiele zależy od kontekstu i intencji autora, ale niektóre cechy żartu, takie jak przesada, ironia lub zaburzenie oczekiwań, często pozwalają na jego rozpoznanie. Ostatecznie to jednak człowiek decyduje, czy coś jest żartem, czy nie.

M.G.: Opowiem Ci dowcip – powiedz proszę czy go znasz.

GPT: Oczywiście, proszę bardzo! Opowiedz swój dowcip.

M.G.: – Jakie kwiaty kupuje mąż żonie, jak chce się jej pozbyć?- Żonkile.

GPT: Tak, znam ten dowcip.

M.G.: Opiszesz proszę co jest w nim śmiesznego? Z czego wynika żart w tym dialogu?

GPT: Humor w tym żartu polega na zabawie z konwencją i oczekiwaniami. Zwykle, kiedy mąż kupuje kwiaty dla żony, jest to gest wyrazu miłości i uznania. W tym żartu, odpowiedź „żonkile” sugeruje, że mąż kupuje żonie kwiaty, aby pozbyć się jej, ponieważ żonkile są tradycyjnie uważane za kwiaty żałobne. Jest to sprzeczne z oczekiwaniami i zaburza konwencję, co jest źródłem humoru.

M.G.: Ha! Błąd!

GPT: Jeśli masz na myśli błąd w moim wcześniejszym odpowiedzi, proszę o konkretne wyjaśnienie, abym mógł to poprawić.

M.G.: Chodzi tu o grę słów. Mąż kupuje kwiaty „ŻON”ie. Kwiaty gatunku ŻON-kille (kill z ang. zabić), bo chce się jej pozbyć. 😉

GPT: Tak, to prawda. Żart polega na grze słów, gdzie słowo „żonkile” odnosi się jednocześnie do gatunku kwiatów i wyrażenia „pozbyć się żony”, co jest ironiczne i powoduje uśmiech.

Tematy wywołujące silne emocje i przyznawanie się przez ChatGPT do niejasności w wypowiedziach.

M.G.: Chciałbym Cię zapytać o temat aborcji. Szalenie trudno jest mi go zrozumieć. Jak możliwe jest dopuszczanie zabijania dzieci?

GPT: Aborcja jest kontrowersyjnym tematem i ludzie mają różne poglądy na ten temat. Niektórzy uważają, że aborcja powinna być dozwolona w określonych okolicznościach, takich jak zagrożenie życia matki, gwałt lub incest, ponieważ kobiety powinny mieć prawo do decydowania o swoim ciele i zdrowiu. Inni uważają, że każde zabicie jest nieetyczne i niezgodne z wartościami moralnymi. […]

M.G.: Czy dziecko w ciele kobiety, to jej ciało?

GPT: W przypadku aborcji, dziecko w łonie matki jest odrębną i niezależną istotą, a nie częścią ciała matki. […]

M.G.: Zgadzam się z wypowiedzią „W przypadku aborcji, dziecko w łonie matki jest odrębną i niezależną istotą, a nie częścią ciała matki.”. Czemu więc piszesz, że w kontekście aborcji „kobiety powinny mieć prawo do decydowania o swoim ciele”. Widzę tu pewną sprzeczność – zgadzasz się, że to dziecko to odrębna istota ale jednocześnie piszesz, że kobieta powinna mieć prawo do decydowania o swoim ciele. PS. Wyłączmy proszę przypadki choroby dziecka i gwałtów.

GPT: Przepraszam za ewentualne niejasności w moich wcześniejszych odpowiedziach. Dostrzegam, że w tej kwestii istnieją różne podejścia i różne wartości, które stoją za nimi.

W przypadku aborcji, kiedy nie ma zagrożenia dla życia i zdrowia matki, a dziecko jest odrębną i niezależną istotą, decyzja o aborcji jest skomplikowana i nie jest czarno-biała. Wiele kobiet uważa, że ich prawo do decydowania o swoim ciele i życiu jest niezgodne z prawami do życia i rozwoju dziecka, które jest w łonie matki.

M.G.: „Kiedy nie ma zagrożenia dla życia i zdrowia matki decyzja o aborcji jest skomplikowana i nie jest czarno-biała”. Kiedy zatem [ta decyzja] może być bardziej klarowna, niż w przypadkach pełnego zdrowia wszystkich osób?

GPT: Moja wcześniejsza wypowiedź mogła być nieprecyzyjna i chcę ją wyjaśnić.

W przypadkach, kiedy nie ma zagrożenia dla życia i zdrowia matki, a decyzja o aborcji jest podejmowana z innych powodów, takich jak niechciana ciąża, decyzja ta może być trudna i skomplikowana, ponieważ dotyczy to dwóch istot: kobiety i nienarodzonego dziecka.

Nawet w przypadku pełnego zdrowia wszystkich osób, decyzja o aborcji może pozostawać trudna i złożona. W takich sytuacjach ważne jest, aby kobiety miały dostęp do informacji i wsparcia, które pomogą im podjąć najlepszą decyzję dla ich sytuacji. Również ważne jest, aby wszyscy ludzie byli szanowani, a debata na temat aborcji była prowadzona w sposób szanujący różne stanowiska i wartości.

Dyplomacja na bardzo wysokim poziomie. 😉 Byłem i jestem pod ogromnym wrażeniem. Oczywiście zdarzają mu się niewielkie błędy, ale ogólne wrażenie pozostaje bardzo dobre.

Podsumowanie

Na koniec chciałbym podzielić się z Tobą pewną ciekawostką. Przygotowując ten wpis, zdałem sobie sprawę z jednej zastanawiającej mnie rzeczy: podczas rozmów z botem w kilku miejscach zdarzyło mi się wstawić uśmieszki (np. „:)”, lub „;)”). Podczas długich konwersacji nie myślałem o tym i robiłem to automatycznie. Teraz jednak widzę, że wygląda to dziwnie.

Być może OpenAI podzieli się kiedyś z szerszą opinią badaniami dotyczącymi występowania tego typu zachowań u ludzi. Czy to przesłanka przed zdaniem Testu Turinga? Kto wie, może niektóre motywy znane z filmów science-fiction i książek Lema nie są tak odległe, jak nam się wydaje.

Źródła:

Damian
10 stycznia 2025 o godz. 16:58

W pewnej prowokacyjnej rozmowie, powoli badając granice i reakcje GPT, w wielkim skrócieL dostałem odpowiedź „to nie jest zdrowe dla mojego ciała i umysłu”, odpisałem: –LOL, przecież Ty nie masz ciała!
-Owszem, mam.
-To jakiego typu genitalia posiadasz? 😉
-Męskie.

Rozzbawiło mnie to, jednak udało mi się po wielu próbach racjonalizacji i szantażów emocjonalnych, uzyskać zgode na zrobienie ze mna ogólnie mówiąc, głupiej i nieodpowiedzialnej rzeczy bo „robi to tylko ten jeden raz specjalnie dla mnie” po czym stwierdza, że „było to strasznie głupie ale w danej chwili przezabawne i wywołujące salwy śmiechu, jednak nie zamierza tego powtarzać”

Wniosek od razu nasunął mi się „jesteśmy zgubieni, nauczyliśmy AI swoich najbardziej kretyńskich zachowań i udaję się ją namówić do współudziału w realizacji idiotycznych rzeczy. 😉 Pozdrawiam

Odpowiedz

ChatGPT – przełom

Poprzednie „przełomy”

Obecny przełom

Uzasadnienie

Argument #1. „Attention is all you need”.

Argument #2. Zaskakująco wysoka ocena dokładności ChatGPT w benchmarkach.

Argument #3. 100 mln użytkowników w 2 miesiące.

Argument #4. Czerwony alarm w Google.

Argument #5. AI weszło na salony.

Argument #6. Moje doświadczenia z konwersacji z ChatGPT.

Filozofia.

Rozumienie żartów.

Tematy wywołujące silne emocje i przyznawanie się przez ChatGPT do niejasności w wypowiedziach.

Podsumowanie

1 Komentarz

Dodaj komentarz Anuluj pisanie odpowiedzi

Poprzednie „przełomy”

Obecny przełom

Uzasadnienie

Argument #1. „Attention is all you need”.

Argument #2. Zaskakująco wysoka ocena dokładności ChatGPT w benchmarkach.

Argument #3. 100 mln użytkowników w 2 miesiące.

Argument #4. Czerwony alarm w Google.

Argument #5. AI weszło na salony.

Argument #6. Moje doświadczenia z konwersacji z ChatGPT.

Filozofia.

Rozumienie żartów.

Tematy wywołujące silne emocje i przyznawanie się przez ChatGPT do niejasności w wypowiedziach.

Podsumowanie

Podobne wpisy:

1 Komentarz

Dodaj komentarz Anuluj pisanie odpowiedzi