06 - LLM როგორ მუშაობს დიდი ენობრივი მოდელი

 


🎓 „გენერაციული AI — თქვენი ორგანიზაციის მომავალი“

📚 კურსს წარმოგიდგენთ პროფესორი ზაზა ცოტნიაშვილი Google Cloud და NotebookLM გამოყენებით


06 - LLM -  როგორ მუშაობს დიდი ენობრივი მოდელი

თუ ოდესმე გისარგებლიათ ისეთი ჩეთბოტით, როგორიცაა ChatGPT, ალბათ გაოცებული დარჩენილხართ მისი უნარით, გასცეს თანმიმდევრული, კრეატიული და ხშირად საოცრად ზუსტი პასუხები. ეს პროცესი იმდენად ბუნებრივია, რომ შეიძლება ჯადოსნურად მოგეჩვენოთ, თითქოს ეკრანის მიღმა ნამდვილი, მოაზროვნე არსება იმალება. მაგრამ რა ხდება სინამდვილეში? როგორ ახერხებს მანქანა ენის ასეთ დონეზე „გაგებას“?

სინამდვილე, როგორც ამას ცნობილი YouTube არხი 3Blue1Brown ხსნის, ბევრად უფრო საინტერესო და მოულოდნელია, ვიდრე ნებისმიერი წარმოდგენა „ჯადოსნურ“ ტექნოლოგიაზე. საქმე არა ცნობიერებაში, არამედ მათემატიკის, გიგანტური მასშტაბებისა და რამდენიმე კონტრ-ინტუიციური მექანიკის ერთობლიობაშია.

ეს სტატია სწორედ ამ მექანიკებს განიხილავს. ჩვენ ჩავუღრმავდებით ხუთ მთავარ იდეას, რომლებიც გვიჩვენებს, თუ რა დგას დიდი ენობრივი მოდელების (LLM) შთამბეჭდავი შესაძლებლობების უკან. მოემზადეთ, რადგან რეალობა ბევრად უფრო გასაოცარია, ვიდრე ფანტაზია.

ეს არ არის აზროვნება, არამედ - შემდეგი სიტყვის  პროგნოზირება

წარმოიდგინეთ, რომ გაქვთ ფილმის სცენარის ნაწილი, სადაც პერსონაჟი ესაუბრება ხელოვნურ ინტელექტს, მაგრამ ასისტენტის პასუხი ამოხეულია. ახლა წარმოიდგინეთ, რომ გაქვთ მანქანა, რომელიც ნებისმიერი ტექსტის საფუძველზე პროგნოზირებს, თუ რა სიტყვა მოჰყვება მას. თქვენ შეგიძლიათ დაასრულოთ სცენარი ამ მანქანის გამოყენებით: შეიყვანთ არსებულ ტექსტს, მანქანა შემოგთავაზებთ მომდევნო სიტყვას, თქვენ დაამატებთ მას ტექსტს და ამ პროცესს გაიმეორებთ უსასრულოდ, სანამ დიალოგი არ დასრულდება.

სწორედ ასე ხდება, როდესაც თქვენ ჩეთბოტს ესაუბრებით. დიდი ენობრივი მოდელი არის დახვეწილი მათემატიკური ფუნქცია, რომლის ერთადერთი მიზანია ნებისმიერი ტექსტისთვის შემდეგი სიტყვის პროგნოზირება. თუმცა, ის არ ირჩევს ერთ კონკრეტულ სიტყვას. ამის ნაცვლად, ის ყველა შესაძლო მომდევნო სიტყვას ანიჭებს ალბათობას. სწორედ ეს მექანიზმი დგას ყველა იმ პასუხის უკან, რომელსაც თქვენ იღებთ.

მისი „განათლების“ მასშტაბი თითქმის წარმოუდგენელია

დიდი ენობრივი მოდელები სწავლობენ ინტერნეტიდან აღებული ტექსტური ინფორმაციის კოლოსალური მოცულობის დამუშავებით. იმისათვის, რომ წარმოიდგინოთ, რამხელა მონაცემებზეა საუბარი, გაითვალისწინეთ შემდეგი ფაქტი: ადამიანს, რომელიც 24 საათის განმავლობაში, კვირაში 7 დღე, შეუჩერებლად იკითხავდა, 2600 წელზე მეტი დასჭირდებოდა მხოლოდ იმ ტექსტის წასაკითხად, რომელიც GPT-3-ის საწვრთნელად გამოიყენეს. მას შემდეგ შექმნილი მოდელები კი ბევრად უფრო დიდ მონაცემთა ბაზებზე იწვრთნება.

ეს კოლოსალური გამოთვლითი სიმძლავრე შემთხვევითი არ არის; ეს არის ენერგია, რომელიც საჭიროა ასობით მილიარდი შიდა „მარეგულირებლის“, ანუ „პარამეტრის“ ზუსტად დასაკალიბრებლად, რომლებიც მოდელის ქცევას განსაზღვრავს. ამ მონაცემების დამუშავებისთვის საჭირო გამოთვლების მასშტაბი გონებისათვის რთულად აღსაქმელია. ამის უკეთ წარმოსადგენად, 3Blue1Brown შემდეგ მაგალითს გვთავაზობს:

წარმოიდგინეთ, რომ შეგიძლიათ წამში ერთი მილიარდი მიმატებისა და გამრავლების ოპერაციის შესრულება. როგორ ფიქრობთ, რამდენი დრო დაგჭირდებათ ყველა იმ ოპერაციის შესასრულებლად, რაც უდიდესი ენობრივი მოდელების გაწვრთნას სჭირდება? [...] სინამდვილეში, პასუხი გაცილებით მეტია. ეს 100 მილიონ წელზე მეტია.

თუმცა, მიუხედავად იმისა, რომ ეს უზარმაზარი მასშტაბი მოდელს საშუალებას აძლევს, ისწავლოს ენის სტატისტიკური კანონზომიერებები, კიდევ ერთი ჭკვიანური ხრიკია საჭირო იმისთვის, რომ მისი პასუხები რობოტული და ხელოვნური არ იყოს, არამედ ბუნებრივად ჟღერდეს.

რატომ არასდროს გაძლევთ მოდელი ერთსა და იმავე პასუხს ორჯერ?

მიუხედავად იმისა, რომ მოდელი თავისი არსით დეტერმინისტულია (ანუ, კონკრეტულ მდგომარეობაში ის ყოველთვის ერთნაირ შედეგს უნდა იძლეოდეს), მისი პასუხები ხშირად შემთხვევითი ჩანს. ეს ხარვეზი კი არა, მიზანმიმართული დიზაინია.

იმისათვის, რომ მოდელის პასუხები უფრო ბუნებრივი და ადამიანური იყოს, მას უფლება ეძლევა, ყოველთვის არ აირჩიოს ყველაზე მაღალი ალბათობის მქონე სიტყვა. ამის ნაცვლად, ის შემთხვევითობის პრინციპით ირჩევს ნაკლებად მოსალოდნელ, მაგრამ მაინც შესაძლო სიტყვებს. სწორედ ეს განზრახ დამატებული შემთხვევითობაა იმის მიზეზი, რომ ერთი და იგივე კითხვის განმეორებით დასმისას ყოველ ჯერზე განსხვავებულ პასუხს იღებთ.

ის ჯერ ინტერნეტიდან სწავლობს, შემდეგ კი — ადამიანებისგან

მოდელის წვრთნა ორ მთავარ ეტაპად იყოფა, რომელთაგან თითოეულს კრიტიკული მნიშვნელობა აქვს.

პირველი ეტაპი არის „წინასწარი წვრთნა“ (Pre-training). ამ დროს მოდელი ამუშავებს ტრილიონობით ტექსტურ მაგალითს ინტერნეტიდან. ის სწავლობს ენის შაბლონებს, გრამატიკას, ფაქტებსა და კონტექსტს. ეს ასე მუშაობს: მოდელში შეჰყავთ მაგალითის ყველა სიტყვა, ბოლოს გარდა, და მოდელის მიერ გაკეთებულ პროგნოზს ადარებენ მაგალითის რეალურ, ბოლო სიტყვას. სწორედ ასე ხდება მისი მილიარდობით „პარამეტრის“ ანუ „წონის“ დაკალიბრება.

მეორე და არანაკლებ მნიშვნელოვანი ეტაპია „განმტკიცებითი სწავლება ადამიანის უკუკავშირით“ (Reinforcement Learning with Human Feedback, ანუ RLHF). ამ ეტაპზე რეალური ადამიანები აფასებენ მოდელის პასუხებს — ისინი აღნიშნავენ არასასარგებლო, პრობლემურ ან მცდარ პასუხებს. ეს უკუკავშირი გამოიყენება მოდელის პარამეტრების შემდგომი კორექტირებისთვის, რათა ის არა უბრალოდ ტექსტის დამსრულებელი, არამედ უკეთესი, უსაფრთხო და სასარგებლო ასისტენტი გახდეს.

საბოლოო ქცევას არავინ აპროგრამებს — ის თავისით ჩნდება

ეს, ალბათ, ერთ-ერთი ყველაზე გასაოცარი ასპექტია. მიუხედავად იმისა, რომ მკვლევრები აპროექტებენ მოდელის ფუნდამენტურ არქიტექტურას (ე.წ. „ტრანსფორმერს“), მის კონკრეტულ, სასარგებლო ქცევას არავინ წერს. ეს ქცევა დაპროგრამებული არ არის — ის ბუნებრივად, თავისით ყალიბდება წვრთნის პროცესში, როგორც განვითარებადი ფენომენი.

წვრთნის დასაწყისში ეს პარამეტრები შემთხვევითი მნიშვნელობებით ივსება, რის გამოც მოდელი თავდაპირველად უბრალოდ უაზრო ტექსტს აგენერირებს. მხოლოდ ტრილიონობით მაგალითზე ავტომატური დაკალიბრების შემდეგ იწყებს მოდელი თანმიმდევრული და სასარგებლო ქცევის გამოვლენას. ეს ქცევა არის განვითარებადი თვისება (emergent property) — ის ბუნებრივად ჩნდება სისტემის უზარმაზარი მასშტაბისა და წვრთნის პროცესის შედეგად და არა წინასწარ დაწერილი წესებით.

კონკრეტული ქცევა არის განვითარებადი ფენომენი, რომელიც დამოკიდებულია იმაზე, თუ როგორ რეგულირდება ასობით მილიარდი პარამეტრი წვრთნის დროს. ეს წარმოუდგენლად ართულებს იმის დადგენას, თუ რატომ აკეთებს მოდელი ზუსტად იმ პროგნოზებს, რომლებსაც აკეთებს.

დასკვნა

შემდეგ ჯერზე, როდესაც ხელოვნური ინტელექტისგან გასაოცრად თანმიმდევრულ პასუხს მიიღებთ, გახსოვდეთ, რომ ეს ჯადოქრობა არ არის. ეს არის მარტივი მიზნის — შემდეგი სიტყვის გამოცნობის — პროდუქტი, რომელიც გაძლიერებულია მონაცემების წარმოუდგენელი მასშტაბით, დახვეწილია როგორც მანქანური, ისე ადამიანური წვრთნით და რომელსაც კრეატიულობის ნაპერწკალს მიზანმიმართული შემთხვევითობა სძენს. ყოველივე ეს კი საბოლოოდ ქმნის კომპლექსურ ქცევას, რომელიც არავის დაუპროგრამებია — ის თავისით ჩნდება, როგორც განვითარებადი ფენომენი.

ეს კი გვიტოვებს საინტერესო ფილოსოფიურ კითხვას: რას ნიშნავს „გაგება“, თუ ის შეიძლება გაჩნდეს სისტემაში, რომლის ერთადერთი ფუნქცია შემდეგი სიტყვის პროგნოზირებაა?



Comments

Popular posts from this blog

დაჯავშნეთ ტრენინგი და გახადეთ როგორც თქვენი პირადი, ასევე თქვენი ორგანიზაციის საქმიანობა ათჯერ ეფექტური

ზაზა ცოტნიაშვილი, ხელოვნური ინტელექტის საფუძვლები: AI ყველასათვის, თბ., 2026

„კონფლიქტების გაშუქება“ – პროფესორ ზაზა ცოტნიაშვილის ახალი წიგნის პრეზენტაცია CIU-ში