вторник, 17 января 2023 г.

ანიმა ანადკუმარ, NVIDIA - ხელოვნური ინტელექტის სწავლების ტექნოლოგიების, მისი ადაპტირებისა და პრობლემების შესახებ

 https://hightech.fm/2020/08/11/ai-anima-anandkumar 

ანიმა ანადკუმარ, NVIDIA -  ხელოვნური ინტელექტის სწავლების ტექნოლოგიების, მისი ადაპტირებისა და პრობლემების შესახებ 

კრისტინა რუდიჩი 

ხელოვნური ინტელექტი თანდათან აღწევს ჩვენი ცხოვრების ყველა სფეროში, მაგრამ პარალელურად ის აგრძელებს დინამიკურ განვითარებას. და მიუხედავად გამაოგნებელი წარმატებებისა - ხელოვნური ინტელექტის გამარჯვება ადამიანებზე გო-ს თამაშში, დრონები და ონკოლოგიის ამოცნობა სურათებზე, ბევრი სფერო მაინც მხოლოდ კვლევის საგანი დარჩა, რაც კიდევ უფრო აქტუალური ხდება პანდემიის პირობებში. „ჰაიტეკმა“ ჩაწერა გამოსვლა NVIDIA-ს მანქანური სწავლების სფეროში კვლევის დირექტორის, ანიმა ანანდკუმარის გამოსვლა Startup Village ონლაინ კონფერენციაზე. ანიმამ ისაუბრა იმაზე, თუ როგორ მოხდა რევოლუცია ღრმა ნეიროქსელების განვითარებაში და რა პერსპექტივები ელის მათ.

ანიმა ანადკუმარ —კალიფორნიის ტექნოლოგიური ინსტიტუტის პროფესორი და NVIDIA-ს მანქანური სწავლების სფეროში კვლევის დირექტორი. მანამდე ის იყო Amazon Web Services-ის მთავარი მეცნიერ თანამშრომელი. მან აქვს რამდენიმე ჯილდო მიღებული, მათ შორის ალფრედ პ. სლოანის სახელობის სტიპენდია, პრემია კარიერისთვის NSF-ში, ახალგაზრდა მკვლევართათვის ჯილდოები თავდაცვის სამინისტროსგან და პედაგოთა სტიპენდიები Microsoft-ისგან, Google-ისა და Adobe-სგან. ის არის მსოფლიო ეკონომიკური ფორუმის ექსპერთა საბჭოს წევრი. გატაცებულია ხელოვნური ინტელექტის ალგორითმების შემუშავებით და მათი გამოყენებით დისციპლინათშორის დანართებში. მისი კვლევები ფოკუსირებულია არაკონტროლოირებულ ხელოვნურ ინტელექტზე, ოპტიმიზაციასა და ტენზორის მეთოდებზე.


„კორონავირუსთან დაკავშირებული სიტუაცია მიგვანიშნებს, რომ ადამიანები ბევრად უსწრებენ ხელოვნურ ინტელექტს“

როგორ დაიწყო ხელოვნური ინტელექტის რევოლუცია?  უკვე რამდენიმე ათეული წელია, ამ სფეროში საინტერესო აღმოჩენები გაკეთდა. ადამიანისთვის არაფერია უფრო ჩვეულებრივი, ვიდრე ეკრანზე გამოსახულებების ამოცნობა. მაგრამ ხელოვნური ინტელექტისთვის ეს უკიდურესად რთული ამოცანაა, რადგან ის არ იბადება ამისთვის უკვე მოცემული შესაძლებლობებით. მეცნიერების წინაშე იდგა ამოცანა „ესწავლებინათ“ მანქანური ტვინისთვის ნანახის იდენტიფიცირება. კვლევის დასაწყისშივე, სტენფორდის ერთ-ერთმა პროფესორმა დაიწყო სურათებისთვის წარწერების გაკეთება, რათა კომპიუტერს გაუადვილდეს მათი კლასიფიცირება. სწორედ მარკირებული სურათები გახდა სიღრმისეული ნეირონული სწავლების რევოლუციის დასაწყისი.

ხელოვნური ინტელექტის განვითარების ახალ დონეზე გასვლა პროგრამაში მილიარდობით პარამეტრის შეტანით დაიწყო, რაც საშუალებას მისცემს მას ამოიცნოს კონკრეტული ობიექტი.  ამოცანის სირთულე იმაში მდგომარეობს, რომ სიღრმისეული ნეიროქსელი, ინვარიანტობის პირობებში, ამოიცნობს, მაგალითად, ძაღლს, მიუხედავად პოზების, ფერის, ჯიშის და ა.შ. ხელოვნური ინტელექტის სწავლება ნიშნავს, რომ გამოსახულების პროცესინგის დროს, კადრის რამდენიმე ფენა განიხილება იერარქიული თანმიმდევრობით. მაგალითად, საბაზისო დონეზე, მხოლოდ ერთმანეთის მიმართ განსხვავებული კუთხით მდებარე ხაზები ჩანს. შემდეგ ისინი უერთდებიან ერთმანეთს და ქმნიან უფრო რთულ ფორმებს, მაგალითად, ძაღლის დრუნჩს ფერებში. უკვე გამოირჩევა ფორმა, ფერი და სხვა ინდივიდუალური მახასიათებლები. ეს ეტაპი, როდესაც ვისწავლეთ პროცესის ნაწილებად, დონეებად დაყოფა, წინ გადადგმული უზარმაზარი ნაბიჯი გახდა.

შემდგომი განვითარებისთვის საჭიროა არა მხოლოდ სიღრმისეული ნეირონული ქსელები, არამედ უზარმაზარი გამოთვლითი სიმძლავრეები.  გასული ათწლეულების განმავლობაში ჩვენ შევნიშნეთ ჩვენი კომპიუტერების შესაძლებლობების ზრდის შენელება, როდესაც ერთნაკადიანი  გამოთვლის სიჩქარე ორჯერ აღარ იზრდება. მაგრამ ამავე დროს, ჩვენ შეგვიძლია პარალელურად გამოვიანგარიშოთ უზარმაზარი მოცულობისა და სირთულის ოპერაციები. სიღრმისეული ქსელების განვითარების თანამედროვე დონემ განაპირობა ის, რომ ახლა მათში ერთდროულად შეიძლება მიმდინარეობდეს მილიარდობით პროცესი. და მათი მიზანი მხოლოდ ერთია: დაადგინონ, რა არის ასახული ფოტოზე. ეს პროცედურა ხორციელდება მატრიცის მულტიპლიკაციური პროცესებისა და სხვა ტექნოლოგიების გამოყენებით. და აქ, რა თქმა უნდა, ეს ყველაფერი დამოკიდებულია ვიდეო ბარათების სიმძლავრეზე.

2014 წლისთვის სიღრმისეული ნეიროქსელები ადამიანებზე უკეთესად ამოიცნობდნენ გამოსახულებებს, რაც იმას ნიშნავს, რომ დღეს ისინი კიდევ უფრო სრულყოფილი გახდნენ. ეს განპირობებული იყო სამი ფაქტორის კომბინაციით: მარკირებული მონაცემების შესაძლებლობების, სიღრმისეული ნეიროქსელების არსებული ალგორითმების მოქნილობის და კომპიუტერების უზარმაზარი შესაძლებლობების წყალობით. არსებობს ბევრი შესანიშნავი მაგალითი იმისა, თუ რა მწვერვალები დაიპყრო მანქანურმა ტვინმა, მაგალითად, გაძლიერებული სიღრმისეული სწავლება ხელოვნურ ინტელექტს დაეხმარა ადამიანის გო-ს თამაშში დაემარცხებინა. ეს მოთამაშე ერთ-ერთი საუკეთესო იყო, მაგრამ მან წააგო. გარდა ამისა, ახლა ხელოვნურ ინტელექტს შეუძლია ადამიანების ფოტოების ისეთი რეალისტური გენერირება, რომ ამ ტექნოლოგიამ უკვე გაიარა ტურინგის ტესტი. ადამიანი ვეღარ ხვდება, რომელი გამოსახულებაა რეალური და რომელი შექმნა მანქანამ. ეს არის ხელოვნური ინტელექტის წარმატებების შესანიშნავი მაგალითები, მაგრამ ამაზე პროგრესი ნამდვილად არ გაჩერდება.

თუმცა, არსებობს მრავალი მაგალითი, სადაც ხელოვნურმა ინტელექტმა არ გაამართლა მოლოდინი. ვთქვათ სიტუაციები, სადაც უსაფრთხოება არის მთავარი ასპექტი. უკვე რამდენიმე ათეული წელია, ჩვენ ვხედავთ ტექნოლოგიების გაძლიერებას, რომლებიც გამოიყენება ავტონომიურ მანქანებში, მაგრამ, სამწუხაროდ, მათი სრულყოფილების ნაკლებობა მაინც იწვევს ავარიებს. ასევე, მანქანა ვერ ჩაანაცვლებს ადამიანს, როდესაც საქმე ეხება კონტენტის შექმნას და რედაქტირებას. და ამჟამინდელი სიტუაცია კორონავირუსთან დაკავშირებით გვიჩვენებს, რომ ადამიანები ბევრად უსწრებენ ხელოვნურ ინტელექტს.

რას გავაკეთებთ მომავალში ხელოვნური ინტელექტისა და სიღრმისეული ნეიროქსელების ტექნოლოგიების შემუშავებით?  ამ დროისთვის რობოტოტექნიკა აქტიურად ვითარდება: მაგალითად, ერთ კომპანიას ჰყავს რობოტი, რომელსაც შეუძლია სალტოს უკან გაკეთება. მაგრამ მას ძაღლსაც კი ვერ შეადარებ. რობოტს მოხერხებულობა აკლია, გამუდმებით ეცემა, ცხოველი კი, როცა ეცემა, სწავლობს, როგორ გააკეთოს ესა თუ ის მოძრაობა შემდეგ ჯერზე ისე, რომ არ დაეცეს. რობოტს ამის უნარი არ გააჩნია, ის არ არის გაწვრთნილი. ეს ბადებს კითხვას, შესაძლებელია თუ არა ისეთი ხელოვნური ინტელექტის შექმნა, რომელიც მზად იქნება ისწავლოს და გადაჭრას პრობლემები დამოუკიდებლად?


„ალგორითმების გაგება ჩვენს შესაძლებლობებს აღემატება“

 ხელოვნური ინტელექტის ალგორითმი არის წინასწარ ჩადებული ინფორმაციის და მეტად მკაფიო დავალების ერთობლიობა.  ჩვენ განვსაზღვრავთ, რა მონაცემები და წინასწარ განსაზღვრული პარამეტრები უნდა იყოს გამოყენებული, ასევე როგორ განვახორციელოთ გადაწყვეტილებების მიღების პროცესი. ხელოვნური ინტელექტის ალგორითმის შექმნა და შენარჩუნება მოითხოვს მონაცემთა უზარმაზარ მოცულობას. ეს რთულია, რადგან მონაცემები უფრო და უფრო იზრდება, მაგალითად, ვიდეო ნაკადის ამოცნობისას, ცნობადი კადრების რაოდენობა ძალიან დიდია. მარკირების ჩატარება პრობლემურია, რადგან ხალხი მილიონობით ვიდეოს ანიჭებს სახელს და, შესაბამისად, ეკრანზე არსებულ ობიექტებს.

 რაც შეეხება წინასწარ ჩადებულ პარამეტრებს, ისევ უნდა შევეხოთ იმას, რომ ყველაფერი ხელით კეთდება.  ახლა ადვილია ხელოვნური ინტელექტის მოტყუება. მაგალითად, თუ გვაქვს გაჩერების ნიშანი და მასზე მოვათავსებთ რამდენიმე ბლოკს, მაშინ ხელოვნური ინტელექტი ვეღარ გაიგებს მის მნიშვნელობას. მძღოლის დახმარების გარეშე მოძრავი მანქანა კი ამ ნიშანს გაჩერების მოწოდებად აღარ ამოიცნობს. ჩვენი ადამიანური ინტელექტი სრულიად განსხვავებულია. შესაძლოა, ჩვენ შევძლებთ ჩვენი აზროვნების წესის კომპიუტერში გადატანას, მაგრამ ჯერჯერობით ეს ვერ მოვახერხეთ. რაც შეეხება ინსტრუქციებს, ბრძანებებს და მითითებებს, აუცილებელია ვიმოქმედოთ ძალიან მარტივად: ვაძლევთ ერთ დავალებას - ამოვიცნოთ ის, რაც ნაჩვენებია ამ სურათზე. რაც შეეხება ალგორითმის წარმატების ან არაეფექტურობის შეფასების პარამეტრებს, აქ ჩვენ ძალიან შეზღუდული ვართ.

 ჩვენ ზოგჯერ ვერ ვხვდებით, რამდენად წარმატებულია მოქმედი ალგორითმი, რადგან ის ჩვენს გაგებას სცილდება.  ასევე, არის რამდენიმე პრობლემა იმ ფაქტთან დაკავშირებით, რომ მონაცემები, რომელიც ჩვენ გვაქვს, ძირითადად ღია ფერი კანის მქონე მამაკაცებს ეხება. ამ მიზეზით, ხელოვნური ინტელექტი არასწორად განსაზღვრავს შავკანიან ქალებს. არსებობს სხვა შეცდომებიც სახის ამოცნობაში. პრობლემა ჩნდება იმის გამო, რომ ხელოვნური ინტელექტის ეფექტურობის შეფასება უკიდურესად შეზღუდულია. ჩვენ არ უნდა დავივიწყოთ პარადიგმა, რომელიც მიგვანიშნებს, რომ ჩვენ გვჭირდება უზარმაზარი მოცულობის მონაცემები, და ეს ყველაფერი უნდა იყოს მარკირებული. წინასწარ განსაზღვრული პარამეტრები უნდა იყოს გასაგები ალგორითმისთვის, ხოლო თავად დავალება უნდა იყოს მარტივი და ლოგიკური.

 პირველ რიგში, თქვენ უნდა დარწმუნდეთ, რომ მონაცემები არ საჭიროებს მარკირებას.  ხელოვნური ინტელექტი ადამიანის დახმარების გარეშე უნდა მუშაობდეს ისე, რომ კომპიუტერმა თავად იპოვნოს კონცეპტები, ჩამოაყალიბოს იდეები და გაიგოს ამა თუ იმ გამოსახულების მახასიათებლები. რთულია? დიახ, ძალიან, მაგრამ ადამიანები ამას აკეთებენ, თანაც ადვილად. რაც შეეხება წინასწარ ჩადებულ მონაცემებს, აქ ჩვენ უნდა შევქმნათ ძალიან მკაფიო გამოსახულებები, რათა ვაჩვენოთ რა არის რა იმ მონაცემებიდან, რომელსაც ჩვენ „მივაწვდით“ სისტემას. და აქ ბევრი რამის სწავლა შეიძლება ადამიანის ტვინიდან. და ბოლოს, დავალებები, რომლებსაც ჩვენ ვაძლევთ ალგორითმს. ხელოვნური ინტელექტი უფრო ადაპტირებული უნდა იყოს, რადგან ახლა ჩვენ ყოველ ჯერზე ვავარჯიშებთ ჩვენს სისტემას ნულიდან, მაგრამ ისე უნდა გავაკეთოთ, რომ მან შეძლოს ადაპტირება და შეცვლა, სხვადასხვა დავალებების შესრულება. ასე რომ, ახლა ჩვენ ვვარჯიშობთ, რათა ხელოვნური ინტელექტი მოქნილი გავხადოთ.


როგორ გავიგოთ, რომ ჩვენ წინაშე კატაა?

ჩვენ ვცნობთ კატას მაშინაც კი, თუ ჩვენს წინაშე ბუნდოვანი სურათია, რადგან ჩვენი ტვინი მუდმივად ცდილობს ბუნდოვან გამოსახულებას მისცეს გარკვეული სიმკვეთრე შემდგომი ანალიზისთვის.  არსებობს მრავალი თეორია, და ერთ-ერთი ყველაზე ცნობილი ამბობს, რომ ჩვენ არა მხოლოდ ვუყურებთ რაღაც ობიექტს, არამედ ამავე დროს ტვინი ირჩევს ვარიანტებს, თუ რა შეიძლება იყოს ის. იგივეს აკეთებენ სიღრმისეული ნეიროული ქსელები. ჩვენ გვაქვს აპრიორული მონაცემებები იმის შესახებ, თუ როგორ უნდა გამოიყურებოდეს კატა. და ჩვენ ვცდილობთ ეს სურათი დავამთხვიოთ იმ აზრთან, თუ როგორ გამოიყურებიან ხვადი კატები. ამის გაგება მნიშვნელოვანია შემუშავებისას, რათა არსებობდეს თანმიმდევრულობა სურათების იდენტიფიკაციაში.

როგორ მივაღწიოთ სტაბილურობას ხელოვნური ქსელებით ობიექტების იდენტიფიკაციაში?  ბუნებრივია, ეს განმეორებით არის განპირობებული. ჩვენ ვიღებთ გარე სურათს და ვუყურებთ მას, სიგნალი კი მიდის ტვინში. ასევე არის დაღმავალი უკუკავშირი. ინფორმაციის გამოყენებით იმის შესახებ, თუ როგორ გამოიყურება კატა, ტვინი აყალიბებს გარკვეულ აღქმას. რა უნდა გავაკეთოთ იმისათვის, რომ ჩვენი ტვინის ეს ყველაზე რთული პროცესები განხორციელებული იყოს ხელოვნური ინტელექტის მიერ? აუცილებელია „კატის“ ცნების, რომელსაც მიაწვდიან ნეირონულ ქსელს, კარგი კლასიფიკატორის გაერთიანება ამ გამოსახულებების შესანიშნავ გენერატორთან. პარალელურად მოხდება ცნების კლასიფიცირება და ნეირონული ქსელის სწავლება. მიღებული იქება უკუკავშირი სტანდარტული ნეირონული ქსელებისთვის. და ეს კავშირი შესაძლებელს გახდის გენერაციული უკუკავშირის მიღებას. სხვა სიტყვებით რომ ვთქვათ, შემომავალი სიგნალის დამუშავების მცდელობისას, ადამიანი ცდილობს გამოსახულების მარკირებას. და მაშინ ჩნდება უკუკავშირი, როდესაც ჩვენ ვცდილობთ აღქმა იმის საფუძველზე გენერირებას, რასაც ვხედავთ. ეს ორი პროცესი ერთმანეთთან უნდა იყოს დაკავშირებული.

სტანდარტულ ნეიროქსელს, როგორც წესი, არ შეუძლია ბუნდოვანი სურათების ამოცნობა, მაგრამ ჩვენი მოდელი, უკუკავშირის მექანიზმის წყალობით, სურათებს უფრო ნათელს ხდის და შემდეგ შეუძლია მათი ამოცნობა.  ჩვენ ვხედავთ, რომ ამგვარმა სქემამ დაამტკიცა თავისი ეფექტურობა, ამიტომ შეგვიძლია შთაგონებული ვიყოთ იმით, თუ როგორ ხედავს ადამიანი კომპიუტერული ხედვის შექმნისას. უკვე შემუშავებულ მოდელებზე დაყრდნობით შესაძლებელია შეიქმნას უფრო სრულყოფილი ალგორითმები, რომლებიც გამოირჩევიან მაღალი წარმადობით. მაგრამ ასევე საჭიროა ეფექტური ინფრასტრუქტურა, რომელსაც შეუძლია ხელოვნური ინტელექტის პროცესების დიდი მასშტაბით დამუშავება. ჩვენ ცალკე არ ვმუშაობთ ალგორითმებთან. თქვენ იღებთ გარკვეულ მონაცემებს და საჭიროა მისი ვიზუალიზაცია, რაც ძალიან რთული პროცესია. ამიტომ საჭიროა ძლიერი პროცესორი, რომელსაც შეუძლია შთამბეჭდავი მოცულობის ინფორმაციის დამუშავება. გარდა ამისა, ჩვენ ვიყენებთ გარკვეულ ჩარჩოებს (CLARA) სხვადასხვა აპლიკაციებისთვის, მათ შორის მედიცინაში. ახლა COVID-19 პანდემიის გათვალისწინებით, გაჩნდა მანქანური სწავლების მოდელების დიდი მასშტაბის მომზადების საჭიროება. ამის მიზანია ვირუსის საწინააღმდეგო ვაქცინებისა და წამლების შემუშავება. CLARA-ს ინსტრუმენტს შეუძლია იმუშაოს მოცულობით სტრუქტურებთან და სხვადასხვა ალგორითმებთან, შესაბამისად, არსებითად, ითვლება  მათი მუშაობის კოორდინატორად.

 ხელოვნური ინტელექტის სწავლების კიდევ ერთი შესაძლებლობა მდგომარეობს სტიმულირებული და არა რეალური მონაცემების გამოყენებაში.  ჩვენ გვყავს რობოტები, რომლებიც შეიძლება გახდნენ შეფ-მზარეულები ჩვენს სამზარეულოში. ასეთ მანქანებს შეუძლიათ უჯრების გამოღება და დახურვა, რაიმე ნივთის აღება, რაღაცის შერევა ან ათქვეფა. ეს ადამიანისთვის მარტივი ოპერაციები ძალიან რთულია რობოტებისთვის, რადგან პრობლემურია მათთვის ამის სწავლება. მაგრამ მოდელირების პროცესების დახმარებით ჩვენ შევძლებთ გამოვაღოთ არარსებული, დაპროგრამებული უჯრები. და ამით რობოტი ახერხებს მსგავსი ოპერაციების სწავლას. პროგრამები საშუალებას გვაძლევს ამის პარალელურად და მასშტაბურად გაკეთების საშუალებას, რათა  დავძლიოთ ის შეზღუდვები, რომლებსაც მონაცემები გვაკისრებს. მაგრამ სწავლის ასეთი სისტემა ნიშნავს, რომ საჭიროა ძალიან რთული ალგორითმების შემუშავება, რომლებიც მანქანას სიმულაციური სამყაროდან რეალურ სამყაროში გადაიყვანს და ხელოვნურ ინტელექტთან მუშაობის სრულიად ახალ, საინტერესო გზებს გახსნის. არსებობს პროგრამა, რომელიც იძლევა სიმულაციის იმ მოდელებზე დამატების საშუალებას, როდესაც ხელოვნური ინტელექტი გადის სწავლებას რეალურ მონაცემებზე. ეს არის კიდევ ერთი მაგალითი იმისა, რომ ჩვენ გვაქვს კარგი ინფრასტრუქტურა და შეგვიძლია გავუმკლავდეთ ძალიან რთულ პრობლემებს. შესაძლებელი გახდა ახალი ალგორითმებისა და მოდელების შექმნა, ასევე მათი ტესტირება ბევრად უფრო სწრაფად, ვიდრე აქამდე ხდებოდა.

ხელოვნური ინტელექტის მომავალი უნდა იყოს ყოვლისმომცველი და განსახიერებული სხვადასხვა სფეროებში, რათა გვქონდეს უაღრესად ადაპტირებადი, მუდმივად სწავლებადი ინსტრუმენტი.  ამისათვის ახლა ჩვენ უნდა ახლებურად გავიაზროთ ღრმა სწავლის მიდგომები. დამოუკიდებელი სწავლა წარმატების საწინდარია, ამიტომ საჭიროა არაკონტროლირებადი სწავლების პროგრამების სისტემებშო დანერგვის ახალი გზების ძიება. და კონვოლუციურ ნეიროქსელებზე საუბრისას, უკუკავშირის სისტემა მათ უფრო სტაბილურს ხდის. ეს არის პირველი ნაბიჯი ახალი თაობის ხელოვნური ინტელექტის რეალური საფუძვლის შესაქმნელად. 


==

მთარგმნელი არ იზიარებს ავტორის მოსაზრებებს , სტატიები ითარგმნება მსჯელობისთვის


Комментариев нет:

Отправить комментарий

Will be revised