AI w praktyce – prosto i przyjemnie

Sztuczna inteligencja, dzięki swoim wszechstronnym zastosowaniom, stała się obiektem intensywnych rozmów, debat, i spekulacji. Wiele przekazów ostrzega przed zagrożeniami i to oczywiście ma swoje uzasadnienie, my zachęcamy do spojrzenia na jasną użytkową stronę AI, bo daje ona coraz więcej fantastycznych możliwości. W dzisiejszym świecie trudno nie usłyszeć o rewolucyjnych osiągnięciach algorytmów opartych na sztucznej inteligencji. Jednak, czy te technologie są rzeczywiście zagrożeniem, czy też kluczem do rozwiązania wielu współczesnych problemów –  czas pokaże . Czy AI  może  na zawsze zmienić naszą rzeczywistość? W poszukiwaniu odpowiedzi na te pytania przyjrzymy się nie tylko ogólnym trendom w rozwoju sztucznej inteligencji, ale także niektórym popularnym narzędziom, takim jak ChatGPT czy Midjourney, które odgrywają kluczową rolę w kształtowaniu tego dynamicznego krajobrazu  technologicznego.

Światło na AI

„Myślę, więc jestem…?” (łac. “Cogito, ergo sum”). AI to przede wszystkim zaawansowana technologia statystyczna, która analizuje dane i uczy się z nich, by wykonywać konkretne zadania. W praktyce oznacza to, że AI potrafi rozpoznawać wzorce, przewidywać wyniki i podejmować decyzje na podstawie danych, które zostały użyte do jej wytrenowania. To nie magia ani superinteligencja; to zaawansowane algorytmy, działające niezwykle szybko, w oparciu o matematykę i statystykę, posadowione na wysoko wydajnym przetwarzaniu. Warto zrozumieć, że obecna AI działa w bardzo ograniczonym zakresie. Choć może wydawać się inteligentna, tak naprawdę nie posiada świadomości, nie rozumie kontekstu świata w sposób, w jaki robią to ludzie, i nie jest zdolna do niezależnego myślenia. Jej ‘inteligencja’ polega na analizowaniu ogromnych ilości danych i wyciąganiu wniosków na tej podstawie. W rezultacie, AI jest narzędziem, które może znacząco usprawnić wiele procesów biznesowych i produktów oraz znacznie ułatwić komunikację marketingową. Ponadto już wpływa na zmiany w wielu obszarach, takich jak analiza medyczna, diagnostyka, predykcja zapasów, sprzedaży, przewidywania dotyczące rozwoju określonego rynku, czy szacowanie ryzyka finansowego, po optymalizację produkcji itp. Jednak nie jest to technologia, która sama z siebie może stanowić zagrożenie.
Oczywiście, pojawiają się obawy związane z rozwojem tzw. Generalnej Sztucznej Inteligencji (AGI) – formy AI, która miałaby zdolności poznawcze na poziomie człowieka, lub nawet je przewyższając. Takie AGI potrafiłoby rozwiązywać problemy w sposób niezależny i kreatywny, co jest zarówno fascynujące, jak i potencjalnie niebezpieczne. Na chwilę obecną, z powszechnie dostępnych źródeł wynika, że jesteśmy jeszcze daleko od tego przełomu. Mimo to, wyniki badań w tej dziedzinie pozostają niedostępne dla szerszej publiczności, co może rodzić uzasadnione obawy. Przykładem są badania prowadzone przez OpenAI nad rozwojem dużych modeli językowych. Dlatego tak ważne jest, aby rozwój AI odbywał się z zachowaniem odpowiednich środków ostrożności, co jest kluczowe dla bezpiecznego i pozytywnego wykorzystania tej technologii w przyszłości.

Chociaż narzędzia opisane poniżej są dalekie od mitycznego AGI, mogą okazać się niezmiernie przydatne w naszym codziennym życiu. Dlatego warto zapoznać się z ich zastosowaniami oraz zrozumieć podstawy ich działania.

NARZĘDZIA AI

„Powiem Ci co dzisiaj myśleć” – ChatGPT & BingAI – Duże modele językowe, takie jak ChatGPT, to złożone systemy sztucznej inteligencji, które naśladują ludzką zdolność do komunikacji. Są to programy komputerowe oparte na skąplikowanych algorytmach, które uczą się języka poprzez analizę ogromnych zbiorów tekstów. Ten proces nazywamy ‘trenowaniem’. Podczas trenowania modelu, program analizuje teksty, ucząc się rozumienia struktury języka, znaczenia słów i kontekstu, w jakim są używane. Model próbuje przewidzieć brakujące słowa w zdaniach i określić, czy dane zdanie jest logiczną kontynuacją poprzedniego. W tym procesie, model wykonuje wiele prób, popełniając nieskończone ilości błędów – stopniowo doskonaląc swoje umiejętności dzięki informacji zwrotnej. Dlatego nauka modeli takich jak ChatGPT potrafi trwać od 90 do 100 dni na dwudziestu pięciu tysiącach potężnych kartach graficznych jednocześnie!

Z biegiem czasu, dzięki analizie dużej ilości tekstu, model zaczyna rozumieć złożone wzorce językowe i może generować odpowiedzi, które brzmią naturalnie dla ludzi. Dodatkowo, modele te są często specjalnie trenowane na zbiorach pytań i odpowiedzi, aby lepiej radzić sobie z generowaniem odpowiedzi w formie naturalnej konwersacji. Warto również zauważyć, że te systemy nie operują bezpośrednio na słowach, jak ludzie. Zamiast tego, używają one liczbowych reprezentacji słów i zdań. Każde słowo jest przekształcane w liczbę lub serię liczb, które model może przetwarzać. Kiedy model generuje tekst, wykorzystuje wewnętrzny ‘słownik’ do przekształcenia tych liczbowych reprezentacji z powrotem na słowa i zdania, tworząc końcową odpowiedź.  Modele językowe jak ChatGPT mają również zdolność do korzystania z internetu, co nie jest żadną formą „tajemniczej siły”, ani nie oznacza początku panowania maszyn nad ludźmi. Ta funkcja opiera się na umiejętności rozumienia tekstu i wykorzystywania go do formułowania zapytań w wyszukiwarkach  internetowych. Model ‘klika’ w linki i dodaje informacje z tych stron do swojego kontekstu, co pozwala na lepsze odpowiedzi na pytania. Jest to jednak jedynie zaawansowane wykorzystanie algorytmów do przeszukiwania i integracji informacji, a nie przejaw samodzielnej świadomości czy zrozumienia.

Podsumowując, duże modele językowe, jak ChatGPT, to imponujące narzędzia AI, które symulują ludzką komunikację. Choć działają one na zasadach algorytmicznych i statystycznych, ich szybkość, i zakres tworzą zdolność do generowania naturalnie brzmiących odpowiedzi. Korzystanie z internetu jest wynikiem skomplikowanego procesu uczenia, analizy i adaptacji do ludzkiego języka, który przyspiesza poszerzanie umiejętności algorytmu AI do dawania trafnych odpowiedzi. Model AI nie powie nam, więc co dzisiaj myśleć, jednak może znaleźć najbardziej pasującą statystycznie podpowiedź w zależności od kontekstu o który zapytamy😊.

„Choć pomaluj mój świat na żółto lub na niebiesko…”(utwór 2 plus 1)–  Midjourney, ChatGPT (Dall-E), Canva (Stable diffusion, dalee, imagen)Kiedy mówimy o narzędziach takich jak MidJourney czy Canva, które wykorzystują modele generujące obrazy, warto zrozumieć podstawy tego, jak działają. Znowu, nie ma tu żadnej magii ani ‘organicznych oczu’ przyłączonych do komputerów. W rzeczywistości, obrazy, które widzimy na ekranach naszych urządzeń, to nic innego jak skomplikowane układy pikseli. Każdy piksel na obrazie składa się z trzech wartości odpowiadających natężeniu kolorów czerwonego, zielonego i niebieskiego. W procesie treningu modeli generujących obrazy, takich jak Stable Diffusion, używane są duże zbiory danych zawierające obrazy oraz ich opisy tekstowe. Na wstępie obrazy są przetwarzane do postaci dwuwymiarowej tabeli z wartościami pikseli (wygląda to jak pojedynczy arkusz w Excel). W ten sposób model zaczyna już “widzieć” co znajduje się na obrazie. Następnie obraz jest przekształcany do postaci jednowymiarowej, a dokładniej w ciągi wartości pikseli. Podczas treningu, modelowi przedstawia się ‘rozmazany’ obrazek wraz z opisem tekstowym (który także jest zamieniany na reprezentację liczbową). Zadaniem modelu jest odtworzenie oryginalnego, wyraźnego obrazu na podstawie tej rozmazanej wersji i dostarczonego opisu. Pomyślmy o tym jak o próbie odgadnięcia, co znajduje się na zamazanej fotografii, mając jedynie krótki opis do pomocy. Sieć neuronowa uczy się w ten sposób rozpoznawać wzorce i tworzyć coraz to lepsze rekonstrukcje obrazów. To jest istota procesu, który sprawia, że narzędzia te mogą tworzyć zadziwiające grafiki oparte na podanych przez użytkowników instrukcjach.

Choć to bardzo uproszczony obraz i nie opisuje wszystkich algorytmów treningu takich modeli, mam nadzieję, że pomogą zrozumieć, jak działa ta fascynująca technologia. Jest to przykład tego, jak zaawansowane algorytmy mogą ‘uczyć się’ interpretować i tworzyć obrazy, co jeszcze kilka lat temu wydawałoby się niemożliwe. Dziś zachęcamy aby polubić użytkowe aspekty AI, bo daje to nam wiele nowych ciekawych możliwości.

 

AUTORZY:Umów Konsultację 
Mateusz Kochanek 4VALUE Busienss Consulting

AI Scientist, ML Researcher and Software Developer
Zajmuje kluczową rolę w dziale IT 4VALUE, gdzie odpowiada za rozwój oprogramowania oraz zarządzanie zespołem specjalistów IT. Specjalizuje się w tworzeniu innowacyjnych algorytmów sztucznej inteligencji, co przekłada się na efektywność i nowoczesność oferowanych rozwiązań biznesowych. Współautor publikacji w dziedzinie AI, “ChatGPT: Jack of all trades, master of none”, przyjętej przez prestiżowe czasopismo Information Fusion.

Absolwent Politechniki Wrocławskiej z tytułem magistra sztucznej inteligencji, posiada również certyfikat CompTIA Security+. W swojej karierze zawodowej zdobył bogate doświadczenie pracując dla firm takich jak Nokia i Capgemini, gdzie koncentrował się na badaniach naukowych, przetwarzaniu danych tekstowych i analizie dużych zbiorów danych. Jego wiedza i umiejętności programistyczne, zwłaszcza w Pythonie i C++, są fundamentem w prowadzeniu projektów i rozwoju oprogramowania w 4VALUE.

Oliwier Kaszyca 4VALUE Busienss Consulting

AI Scientist, ML Researcher and Software Developer.
Odpowiada za rozwój oprogramowania oraz metod opartych na sztucznej inteligencji.

Posiada wieloletnie doświadczenie jako inżynier oprogramowania. Magister sztucznej inteligencji, specjalizujący się w dziedzinie przetwarzanie języka naturalnego (NLP) oraz dużych modeli językowych (LLM). Prowadzi badania obszarze sztucznej inteligencji we współpracy z Politechniką Wrocławską. Współautor publikacji w dziedzinie AI, “ChatGPT: Jack of all trades, master of none”, przyjętej przez prestiżowe czasopismo Information Fusion.

GRAFIKA:
Agata Muszyńska