04/02/2026
"လက်တွေ့ကမ္ဘာအပေါ် နားလည်ပုံဖော်ရာ၌ AI မော်ဒယ်များ တစ်လမ်းတည်း ဆုံလာကြခြင်း"
ခွေးတွေအကြောင်း ပုံပြင်တစ်ပုဒ်ကို သင်ဖတ်ဖူးတယ်ဆိုပါစို့။ နောက်တစ်ခါ ပန်းခြံထဲမှာ ခွေးတစ်ကောင် ပြေးလွှားနေတာကို မြင်တဲ့အခါ အဲဒီပုံပြင်ကို သင်ပြန်သတိရပါလိမ့်မယ်။ ဒါဟာ ဘာကြောင့်ဖြစ်နိုင်သလဲဆိုတော့ သင့်ဦးနှောက်ထဲမှာ "ခွေး" ဆိုတဲ့ အယူအဆတစ်ခုဟာ စကားလုံး ဒါမှမဟုတ် ရုပ်ပုံတစ်ခုတည်းနဲ့တင် မဟုတ်ဘဲ အားလုံးပေါင်းစည်းပြီးသား concept တစ်ခုအနေနဲ့ ရှိနေလို့ပါ။ ဘူဒေါ့ (Bulldog) ဖြစ်ဖြစ်၊ ဘော်ဒါကိုလီ (Border collie) ဖြစ်ဖြစ်၊ ဟောင်နေတာပဲဖြစ်ဖြစ်၊ ဗိုက်ပွတ်ပေးတာ ခံနေရတာပဲဖြစ်ဖြစ် ခွေးဟာ ပုံစံအမျိုးမျိုးရှိနိုင်ပေမဲ့ သူ့ရဲ့ "ခွေး" ဆိုတဲ့ အနှစ်သာရကတော့ ပြောင်းလဲမသွားပါဘူး။
ဉာဏ်ရည်တု (AI) စနစ်တွေမှာတော့ ဒီလိုဖြစ်ဖို့ အမြဲတမ်း မလွယ်ကူပါဘူး။ ဒီစနစ်တွေဟာ Training လို့ခေါ်တဲ့ သင်ကြားပြသမှု ဖြစ်စဉ်မှာ ဒေတာ (data) အမြောက်အမြားကို လေ့လာပြီး တတ်မြောက်လာကြတာပါ။ များသောအားဖြင့် အဲဒီဒေတာတွေဟာ အမျိုးအစားတစ်ခုတည်း ဖြစ်နေတတ်ပါတယ်။ ဥပမာ- Language model တွေအတွက်ဆိုရင် စာသားတွေ၊ Computer vision စနစ်တွေအတွက်ဆိုရင် ရုပ်ပုံတွေ၊ ဒါမှမဟုတ် ပရိုတင်းတည်ဆောက်ပုံကို ခန့်မှန်းတဲ့စနစ်တွေအတွက်ဆိုရင် သက်ဆိုင်ရာ ဒေတာအမျိုးအစားတွေပေါ့။ ဒါဆိုရင် ဘာသာစကားမော်ဒယ် (Language model) နဲ့ အမြင်အာရုံမော်ဒယ် (Vision model) တွေအကြားမှာ "ခွေး" ဆိုတဲ့ အယူအဆအပေါ် တူညီတဲ့ နားလည်မှု ဘယ်လောက်အထိ ရှိနိုင်သလဲ?
သုတေသနပညာရှင်တွေဟာ AI စနစ်တွေရဲ့ အတွင်းပိုင်းကို စစ်ဆေးပြီး မြင်ကွင်းတွေနဲ့ ဝါကျတွေကို ဒီစနစ်တွေက ဘယ်လိုပုံဖော်သလဲ (represent လုပ်သလဲ) ဆိုတာကို လေ့လာခြင်းအားဖြင့် ဒီမေးခွန်းတွေကို အဖြေရှာကြပါတယ်။ နောက်ပိုင်း ထွက်ပေါ်လာတဲ့ သုတေသနတွေအရ AI မော်ဒယ်အမျိုးမျိုးဟာ သင်ကြားပေးတဲ့ ဒေတာအမျိုးအစား မတူရင်တောင်မှ အတွင်းပိုင်းမှာ ပုံဖော်နားလည်ပုံချင်း ဆင်တူလာတာကို တွေ့ရှိရပါတယ်။ ပိုပြီး ထူးခြားတာက မော်ဒယ်တွေဟာ ပိုပြီးစွမ်းဆောင်ရည် မြင့်မားလာလေလေ၊ သူတို့ရဲ့ နားလည်ပုံတွေဟာ တစ်ခုနဲ့တစ်ခု ပိုပြီးတူညီလာလေလေပါပဲ။ ၂၀၂၄ ခုနှစ်မှာ MIT က သုတေသီလေးဦးက ဒီလို တူညီလာတာဟာ တိုက်ဆိုင်မှုမဟုတ်ဘူးလို့ ဆိုခဲ့ပါတယ်။ သူတို့ရဲ့ အိုင်ဒီယာကို "Platonic representation hypothesis" လို့ အမည်ပေးထားပြီး ဒါဟာ သုတေသီတွေကြားမှာ အကြီးအကျယ် ဆွေးနွေးငြင်းခုံစရာ ဖြစ်လာခဲ့ပါတယ်။
ဒီသီအိုရီရဲ့ အမည်ဟာ လွန်ခဲ့တဲ့ နှစ်ပေါင်း ၂,၄၀၀ က ဂရိတွေးခေါ်ရှင် ပလေတို (Plato) ရဲ့ ဥပမာပေးပုံပြင် (Allegory of the Cave) ကို အစွဲပြုပြီး ပေးထားတာပါ။ အဲဒီပုံပြင်မှာ ဂူထဲမှာ ပိတ်မိနေတဲ့ အကျဉ်းသားတွေဟာ ပြင်ပက အရာဝတ္ထုတွေကြောင့် ဖြစ်ပေါ်လာတဲ့ "အရိပ်" တွေကိုပဲ ကြည့်ပြီး ကမ္ဘာကြီးကို သိမြင်ကြရပါတယ်။ ပလေတိုကတော့ ကျွန်တော်တို့အားလုံးဟာ အဲဒီအကျဉ်းသားတွေလိုပါပဲလို့ ဆိုပါတယ်။ ကျွန်တော်တို့ နေ့စဉ်တွေ့ကြုံနေရတဲ့ အရာတွေဟာ တကယ့်အစစ်အမှန် "စံ" (ideal forms) တွေရဲ့ အရိပ်တွေသာ ဖြစ်တယ်လို့ သူက ယူဆပါတယ်။
AI နဲ့ ပတ်သက်တဲ့ "Platonic representation hypothesis" ကတော့ အဲဒီလောက်အထိ သိမ်မွေ့နက်နဲမှုတော့ မရှိပါဘူး။ ဒီဗားရှင်းမှာတော့ ဂူအပြင်ဘက်က အစစ်အမှန်ကမ္ဘာကြီးဖြစ်ပြီး၊ အဲဒီကမ္ဘာက ထွက်ပေါ်လာတဲ့ ဒေတာစီးကြောင်း (data streams) တွေဟာ စက်တွေဖတ်လို့ရတဲ့ အရိပ်တွေ ဖြစ်ပါတယ်။ AI မော်ဒယ်တွေဟာ အကျဉ်းသားတွေပေါ့။ MIT အဖွဲ့ရဲ့ အဆိုအရတော့ မတူညီတဲ့ AI မော်ဒယ်တွေဟာ ဒေတာအရိပ်တွေကိုပဲ လေ့လာရပေမဲ့ နောက်ဆုံးမှာတော့ အဲဒီဒေတာတွေရဲ့ နောက်ကွယ်က အစစ်အမှန်ကမ္ဘာကြီးရဲ့ "Platonic representation" (စုံညီနားလည်မှု) ဆီကို စုစည်းရောက်ရှိသွားကြတယ်လို့ ဆိုပါတယ်။
"ဘာကြောင့် ဘာသာစကားမော်ဒယ်နဲ့ အမြင်အာရုံမော်ဒယ်က တူညီသွားတာလဲ? ဘာလို့လဲဆိုတော့ သူတို့နှစ်ခုလုံးဟာ ကမ္ဘာကြီးတစ်ခုတည်းရဲ့ အရိပ်တွေ ဖြစ်နေလို့ပါပဲ" လို့ ဒီစာတမ်းရဲ့ အဓိကစာရေးသူ Phillip Isola က ပြောပါတယ်။
ဒါကို လူတိုင်းကတော့ လက်မခံကြပါဘူး။ အဓိက ငြင်းခုံရတဲ့ အချက်ကတော့ ဘယ်လို နားလည်ပုံမျိုးကို အဓိကထားမလဲ ဆိုတာပါပဲ။ AI မော်ဒယ်တစ်ခုရဲ့ အတွင်းပိုင်းကို ဖြစ်နိုင်သမျှ ဝါကျတိုင်း၊ ပုံတိုင်းအတွက် လိုက်ပြီး စစ်ဆေးဖို့ မဖြစ်နိုင်ပါဘူး။ ဒါဆိုရင် ဘယ်အချက်က "ကိုယ်စားပြုချက်" ဖြစ်တယ်ဆိုတာ ဘယ်လို ဆုံးဖြတ်မလဲ? မတူညီတဲ့ မော်ဒယ်တွေအကြား ဘယ်လို နှိုင်းယှဉ်မလဲ? ဒီသီအိုရီအပေါ် သုတေသီတွေကြားမှာ တူညီတဲ့ သဘောတူညီချက်ရဖို့တော့ အချိန်အတော်လိုဦးမှာပါ။ ဒါပေမဲ့ Isola ကတော့ ဒါကို ဂရုမစိုက်ပါဘူး။
"ပညာရှင်တစ်ဝက်က ဒါဟာ သိသာထင်ရှားတဲ့အမှန်တရားလို့ ပြောကြပြီး၊ ကျန်တဲ့တစ်ဝက်ကတော့ ဒါဟာ လုံးဝမှားယွင်းနေတယ်လို့ ပြောကြပါတယ်။ ဒီလို တုံ့ပြန်မှုမျိုး ရတာကိုပဲ ကျွန်တော်တို့ ကျေနပ်ပါတယ်" လို့ သူက ဆိုပါတယ်။
ကိန်းဂဏန်းများဖြင့် တည်ဆောက်ထားသော ကမ္ဘာ
အကယ်၍ AI သုတေသီတွေဟာ ပလေတို (Plato) ရဲ့ အယူအဆအပေါ် သဘောမတူကြဘူးဆိုရင်တောင် သူ့ရဲ့ ရှေ့ဆောင်ဖြစ်တဲ့ ပိုက်သဂိုးရပ်စ် (Pythagoras) နဲ့တော့ တူညီတဲ့ အမြင်တစ်ခု ရှိနိုင်ပါတယ်။ ပိုက်သဂိုးရပ်စ်ရဲ့ ဒဿနက "အရာအားလုံးဟာ ကိန်းဂဏန်းတွေပဲ" ဆိုတဲ့ အဆိုအပေါ်မှာ အခြေခံထားတာပါ။ ဒါဟာ AI မော်ဒယ်တွေကို မောင်းနှင်ပေးနေတဲ့ နျူရယ်ကွန်ရက် (Neural networks) တွေကို ဖော်ပြဖို့ အလွန်သင့်တော်တဲ့ စကားရပ်ပဲ ဖြစ်ပါတယ်။ သူတို့ရဲ့ စကားလုံးတွေ ဒါမှမဟုတ် ရုပ်ပုံတွေကို ပုံဖော်နားလည်မှုဆိုတာ တကယ်တော့ ကိန်းဂဏန်းတွေ အရှည်ကြီး စာရင်းပြုစုထားတာပဲ ဖြစ်ပြီး၊ ကိန်းဂဏန်းတစ်ခုချင်းစီက သတ်မှတ်ထားတဲ့ အတုလုပ်နျူရွန် (artificial neuron) တစ်ခုရဲ့ တက်ကြွလှုပ်ရှားမှု အတိုင်းအတာကို ဖော်ပြနေတာပါ။
သင်္ချာနည်းအရ တွက်ချက်ရလွယ်ကူစေဖို့ သုတေသီတွေဟာ နျူရယ်ကွန်ရက်ရဲ့ အလွှာ (Layer) တစ်ခုချင်းစီကိုပဲ သီးခြားခွဲထုတ်ပြီး လေ့လာလေ့ရှိပါတယ်။ ဒါဟာ ဦးနှောက်ရဲ့ တိကျတဲ့ နေရာတစ်ခုမှာ တိကျတဲ့ အချိန်တစ်ခုအတွင်း ဖြစ်ပေါ်နေတဲ့ လှုပ်ရှားမှုကို ဓာတ်ပုံရိုက်ယူလိုက်တာနဲ့ တူပါတယ်။ သူတို့ဟာ အဲဒီအလွှာမှာရှိတဲ့ နျူရွန်တွေရဲ့ လှုပ်ရှားမှုကို ဗက်တာ (Vector) လို့ခေါ်တဲ့ ဂျီဩမေတြီ အရာဝတ္ထုတစ်ခုအနေနဲ့ ချရေးကြပါတယ်။ ဗက်တာဆိုတာ (Abstract space) ထဲမှာ တိကျတဲ့ လားရာတစ်ခုဆီကို ညွှန်ပြနေတဲ့ "မြား" တစ်ခုနဲ့ တူပါတယ်။ ခေတ်သစ် AI မော်ဒယ်တွေရဲ့ အလွှာတစ်ခုစီမှာ နျူရွန်ပေါင်း သောင်းနဲ့ချီ ရှိနေတာကြောင့် သူတို့ရဲ့ ပုံဖော်နားလည်မှုတွေဟာ အဘက်ဘက်က မြင်နိုင်စွမ်းရှိတဲ့ (High-dimensional) ဗက်တာတွေ ဖြစ်နေပြီး လူတွေအနေနဲ့ တိုက်ရိုက်မြင်ယောင်ကြည့်ဖို့ မဖြစ်နိုင်ပါဘူး။ ဒါပေမဲ့ ဗက်တာတွေဟာ မော်ဒယ်တစ်ခုရဲ့ နားလည်ပုံကို နှိုင်းယှဉ်ဖို့ လွယ်ကူစေပါတယ်။ တကယ်လို့ ဗက်တာနှစ်ခုဟာ လားရာချင်း တူညီနေမယ်ဆိုရင် အဲဒီပုံဖော်နားလည်မှု နှစ်ခုဟာ ဆင်တူတယ်လို့ သတ်မှတ်နိုင်ပါတယ်။
AI မော်ဒယ်တစ်ခုတည်းအတွင်းမှာဆိုရင် ဆင်တူတဲ့ အချက်အလက် (input) တွေဟာ ဆင်တူတဲ့ ပုံဖော်နားလည်မှုတွေ ရှိတတ်ပါတယ်။ ဥပမာ- ဘာသာစကားမော်ဒယ်တစ်ခုမှာ "ခွေး" (dog) ဆိုတဲ့ စကားလုံးကို ကိုယ်စားပြုတဲ့ ဗက်တာဟာ "အိမ်မွေးတိရစ္ဆာန်" (pet)၊ "ဟောင်သံ" (bark) နဲ့ "အမွှေးဖွဖွ" (furry) စတဲ့ စကားလုံးတွေရဲ့ ဗက်တာတွေနဲ့ နီးကပ်နေမှာဖြစ်ပြီး၊ "ပလေတိုနည်းကျ" (Platonic) ဒါမှမဟုတ် "တင်လဲရည်" (molasses) စတဲ့ စကားလုံးတွေနဲ့တော့ ဝေးကွာနေမှာပါ။ ဒါဟာ လွန်ခဲ့တဲ့ နှစ်ပေါင်း ၆၀ ကျော်က ဗြိတိသျှ ဘာသာဗေဒပညာရှင် ဂျွန် ရူးပတ် ဖတ်သ် (John Rupert Firth) ပြောခဲ့တဲ့ "စကားလုံးတစ်လုံးရဲ့ အဓိပ္ပာယ်ကို သူနဲ့ တွဲဖက်နေထိုင်တဲ့ အပေါင်းအသင်းတွေကတစ်ဆင့် သိနိုင်တယ်" ဆိုတဲ့ အယူအဆကို သင်္ချာနည်းအရ တိတိကျကျ ဖော်ထုတ်လိုက်တာပဲ ဖြစ်ပါတယ်။
ဒါဆိုရင် မတူညီတဲ့ မော်ဒယ်တွေအကြားမှာကော ဘယ်လိုနှိုင်းယှဉ်မလဲ? မတူညီတဲ့ ကွန်ရက်တွေကလာတဲ့ ဗက်တာတွေကို တိုက်ရိုက်နှိုင်းယှဉ်ဖို့ကတော့ အဓိပ္ပာယ်မရှိပါဘူး။ ဒါပေမဲ့ သုတေသီတွေဟာ သွယ်ဝိုက်တဲ့ နည်းလမ်းတွေနဲ့ နှိုင်းယှဉ်ဖို့ ကြံဆခဲ့ကြပါတယ်။ လူကြိုက်များတဲ့ နည်းလမ်းတစ်ခုကတော့ ဖတ်သ်ရဲ့ စကားကိုပဲ နမူနာယူပြီး မော်ဒယ်နှစ်ခုစလုံးမှာ အချက်အလက်တစ်ခုကို ပုံဖော်တဲ့အခါ သူတို့ရဲ့ "အပေါင်းအသင်း" (ပတ်ဝန်းကျင်က ဗက်တာတွေ) အချင်းချင်း တူညီမှု ရှိ၊ မရှိ တိုင်းတာတာပဲ ဖြစ်ပါတယ်။
ဥပမာ.... သင်ဟာ ဘာသာစကားမော်ဒယ် နှစ်ခုက တိရစ္ဆာန်အမည်တွေကို ဘယ်လို ပုံဖော်သလဲဆိုတာ နှိုင်းယှဉ်ချင်တယ်ဆိုပါစို့။ အရင်ဆုံး ခွေး၊ ကြောင်၊ ဝံပုလွေ၊ jellyfish စတဲ့ စကားလုံးစာရင်းတစ်ခုကို ပြုစုရပါမယ်။ အဲဒီနောက် အဲဒီစကားလုံးတွေကို မော်ဒယ်နှစ်ခုစလုံးထဲကို ထည့်သွင်းပြီး သူတို့ရဲ့ ဗက်တာတွေကို မှတ်တမ်းတင်ရမှာပါ။ မော်ဒယ်တစ်ခုစီမှာ အဲဒီဗက်တာတွေဟာ အစုအဖွဲ့ (cluster) တစ်ခုစီအဖြစ် ဖြစ်ပေါ်လာပါလိမ့်မယ်။ အဲဒီနောက်မှာတော့ သင်က "ဒီအစုအဖွဲ့ နှစ်ခုရဲ့ ပုံသဏ္ဌာန်ချင်း ဘယ်လောက်တူသလဲ" ဆိုတာကို မေးခွန်းထုတ်နိုင်ပါပြီ။
"ဒါကို တူညီမှုတွေရဲ့ တူညီမှုကို တိုင်းတာတာလို့တောင် ဖော်ပြလို့ရပါတယ်" လို့ New York တက္ကသိုလ်က AI သုတေသီ အီလီယာ ဆူချိုလတ်စကီး (Ilia Sucholutsky) က ပြောကြားခဲ့ပါတယ်။
****
ဤရိုးရှင်းသော ဥပမာအရ မော်ဒယ်နှစ်ခုကြားတွင် ဆင်တူမှုအချို့ရှိနေမည်ဟု သင်မျှော်လင့်နိုင်ပါသည်။ ဥပမာအားဖြင့် မော်ဒယ်နှစ်ခုစလုံးတွင် “ကြောင်” (cat) ဗက်တာသည် “ခွေး” (dog) ဗက်တာနှင့် နီးကပ်စွာရှိနေနိုင်ပြီး (jellyfish) ဗက်တာကတော့ အခြားလားရာတစ်ခုသို့ ညွှန်ပြနေပါလိမ့်မည်။ သို့သော်လည်း ထိုဗက်တာအစုအဖွဲ့ (clusters) နှစ်ခုသည် တစ်ထပ်တည်း တူညီနေမည်တော့ မဟုတ်ပါ။ “ခွေး” သည် “ကြောင်” နှင့် ပိုတူသလား သို့မဟုတ် “ဝံပုလွေ” နှင့် ပိုတူသလား? အကယ်၍ သင့်မော်ဒယ်များကို မတူညီသော ဒေတာအစုအဝေးများဖြင့် သင်ကြားထားခြင်း သို့မဟုတ် မတူညီသော ကွန်ရက်တည်ဆောက်ပုံ (architectures) များဖြင့် တည်ဆောက်ထားခြင်း ဖြစ်ပါက ၎င်းတို့၏ အဖြေချင်း တူညီချင်မှ တူညီပါလိမ့်မည်။
သုတေသီများသည် ၂၀၁၀ ပြည့်နှစ်များ အလယ်ပိုင်းတွင် ဤနည်းလမ်းကို အသုံးပြု၍ AI မော်ဒယ်များကြားရှိ ပုံဖော်နားလည်မှု ဆင်တူခြင်း (representational similarity) ကို စတင်လေ့လာခဲ့ကြသည်။ မတူညီသော မော်ဒယ်များတွင် တူညီသော အယူအဆတစ်ခုကို ပုံဖော်ပုံချင်းမှာ လုံးဝတစ်ထပ်တည်း မကျသော်လည်း မကြာခဏဆိုသလို ဆင်တူနေတတ်သည်ကို တွေ့ရှိရသည်။ စိတ်ဝင်စားစရာမှာ စွမ်းဆောင်ရည်ပိုမြင့်သော မော်ဒယ်များသည် အားနည်းသော မော်ဒယ်များထက် ပုံဖော်နားလည်မှုချင်း ပို၍ဆင်တူပုံရကြောင်း သုတေသနအချို့က ဆိုသည်။ ၂၀၂၁ ခုနှစ် စာတမ်းတစ်ခုတွင် ယင်းကို “အန်နာ ကာရင်နီနာ အခြေအနေ” (Anna Karenina scenario) ဟု အမည်ပေးခဲ့သည်။ ၎င်းမှာ တော်စတွိုင်း (Tolstoy) ၏ ဂန္ထဝင်ဝတ္ထုကြီး၏ အဖွင့်စာသားကို အစွဲပြုထားခြင်း ဖြစ်သည်။ ဖြစ်နိုင်သည်မှာ - အောင်မြင်သော AI မော်ဒယ်များသည် အားလုံးဆင်တူကြပြီး၊ မအောင်မြင်သော မော်ဒယ်တိုင်းမှာမူ မိမိတို့နည်းလမ်းအသွယ်သွယ်ဖြင့် ကွဲပြားစွာ မအောင်မြင်ကြခြင်း ဖြစ်ပေလိမ့်မည်။
ယခင်က သုတေသနအစောပိုင်းကာလများတွင် ထိုစဉ်က ရေပန်းအစားဆုံးဖြစ်သော ကွန်ပျူတာ အမြင်အာရုံ (computer vision) ကဏ္ဍကိုသာ အဓိကထားခဲ့ကြသော်လည်း စွမ်းအားမြင့် ဘာသာစကားမော်ဒယ် (language models) များ ထွက်ပေါ်လာခြင်းက အခြေအနေကို ပြောင်းလဲစေခဲ့သည်။ Isola အတွက်မူ ဤပုံဖော်နားလည်မှု ဆင်တူခြင်းသည် မည်မျှအထိ ခရီးပေါက်နိုင်မည်နည်းဆိုသည်ကို စမ်းသပ်ရန် အခွင့်အရေးတစ်ခု ဖြစ်လာခဲ့သည်။
တူညီသောလားရာသို့ ဆင့်ကဲပြောင်းလဲလာခြင်း (Convergent Evolution)
"Platonic representation hypothesis" သုတေသနစာတမ်း၏ အစမှာ AI သုတေသီများအတွက် အလှုပ်ခတ်ဆုံးအချိန်ဖြစ်သည့် ၂၀၂၃ ခုနှစ်အစောပိုင်းတွင် စတင်ခဲ့သည်။ ထိုအချိန်မှာ ChatGPT ထွက်ရှိပြီးကာစဖြစ်ပြီး AI မော်ဒယ်များကို ပိုမိုကြီးမားအောင်လုပ်ခြင်း (နျူရယ်ကွန်ရက်များကို ပိုမိုကြီးမားစေပြီး ဒေတာများစွာဖြင့် သင်ကြားခြင်း) သည် မတူညီသော အလုပ်များကို ပိုမိုကောင်းမွန်စွာ လုပ်ဆောင်နိုင်စွမ်းရှိလာကြောင်း ပို၍သိသာလာသည့် အချိန်ဖြစ်သည်။ သို့သော် ထိုသို့ဖြစ်ရသည့် အကြောင်းရင်းကိုမူ ရှင်းရှင်းလင်းလင်း မသိရှိကြသေးပေ။
"AI သုတေသနလောကထဲက လူတိုင်းဟာ ဖြစ်တည်မှုဆိုင်ရာ အကျပ်အတည်းတစ်ခုကို ဖြတ်ကျော်နေကြရတာပါ" ဟု ထိုစဉ်က Isola ၏ ဓာတ်ခွဲခန်းတွင် ကျောင်းသားဖြစ်ခဲ့ပြီး ယခုအခါ OpenAI တွင် အလုပ်လုပ်နေသည့် သုတေသီ Minyoung Huh က ပြောကြားခဲ့သည်။ မော်ဒယ်များကို ပိုမိုချဲ့ထွင်ခြင်း (Scaling) က ၎င်းတို့၏ အတွင်းပိုင်း ပုံဖော်နားလည်မှုများအပေါ် မည်သို့သက်ရောက်မှုရှိနိုင်သနည်းဆိုသည်ကို ဆွေးနွေးရန် သူသည် Isola နှင့် လုပ်ဖော်ကိုင်ဖက်များဖြစ်ကြသော Brian Cheung ၊ Tongzhou Wang တို့နှင့် ပုံမှန်တွေ့ဆုံခဲ့ကြသည်။
မော်ဒယ်အမြောက်အမြားကို ဒေတာတစ်ခုတည်းဖြင့် သင်ကြားပေးထားပြီး စွမ်းဆောင်ရည်ပိုကောင်းသော မော်ဒယ်များက ပိုမိုဆင်တူသော နားလည်မှုများကို ရရှိလာသည့် အခြေအနေကို မြင်ယောင်ကြည့်ပါ။ ဤသို့ဖြစ်ရခြင်းမှာ မော်ဒယ်များက ကမ္ဘာကြီးကို ပိုမိုတိကျစွာ ပုံဖော်လာနိုင်ခြင်းကြောင့်သာ ဖြစ်ရမည်ဟု တထစ်ချပြောရန် ခက်ခဲပါသေးသည်။ ၎င်းတို့သည် သင်ကြားပေးထားသည့် ဒေတာအစုအဝေး၏ ထူးခြားချက် (Quirks) များကိုသာ ပိုမိုနားလည်လာခြင်းလည်း ဖြစ်နိုင်သောကြောင့်ဖြစ်သည်။
သို့သော် မတူညီသော ဒေတာအစုအဝေး (different datasets) များဖြင့် သင်ကြားထားသည့် မော်ဒယ်များ၏ နားလည်ပုံချင်း ဆုံမှတ်တစ်ခုသို့ ရောက်ရှိလာမည်ဆိုပါက ထိုအချက်မှာ မော်ဒယ်များသည် ဒေတာများ၏ နောက်ကွယ်ရှိ ကမ္ဘာကြီး၏ တူညီသော အသွင်အပြင်များကို ပိုမိုနားလည်လာကြသည်ဟူသော ခိုင်လုံသည့် သက်သေတစ်ခု ဖြစ်လာပါလိမ့်မည်။ အထူးသဖြင့် ဘာသာစကားမော်ဒယ်နှင့် အမြင်အာရုံမော်ဒယ်များကဲ့သို့ လုံးဝကွဲပြားသော ဒေတာအမျိုးအစားများမှ သင်ယူထားသည့် မော်ဒယ်များအကြား တူညီမှုရှိလာခြင်းသည် ပို၍ပင် ခိုင်မာသော သက်သေဖြစ်ပေလိမ့်မည်။
ဆွေးနွေးမှုများစတင်ပြီး တစ်နှစ်အကြာတွင် Isola နှင့် သူ၏လုပ်ဖော်ကိုင်ဖက်များသည် ဤအယူအဆအတွက် သက်သေများကို ပြန်လည်သုံးသပ်သည့် စာတမ်းတစ်စောင်ကို ရေးသားရန် ဆုံးဖြတ်ခဲ့ကြသည်။ ထိုအချိန်တွင် အခြားသော သုတေသီများကလည်း အမြင်အာရုံနှင့် ဘာသာစကားမော်ဒယ်များအကြား ဆင်တူမှုများကို စတင်လေ့လာနေကြပြီဖြစ်သည်။ Huh သည်လည်း ကိုယ်ပိုင်စမ်းသပ်မှုတစ်ခုကို ပြုလုပ်ခဲ့ပြီး Wikipedia မှ စာသားပါသော ပုံများကို အသုံးပြုကာ အမြင်အာရုံမော်ဒယ် ၅ ခုနှင့် ဘာသာစကားမော်ဒယ် ၁၁ ခုကို စမ်းသပ်ခဲ့သည်။ သူသည် ပုံများကို အမြင်အာရုံမော်ဒယ်ထဲသို့ ထည့်သွင်းပြီး စာသားများကို ဘာသာစကားမော်ဒယ်ထဲသို့ ထည့်သွင်းကာ ၎င်းတို့၏ ဗက်တာအစုအဖွဲ့များကို နှိုင်းယှဉ်ကြည့်ခဲ့သည်။ မော်ဒယ်များ ပိုမိုစွမ်းအားကြီးလာသည်နှင့်အမျှ ၎င်းတို့၏ ပုံဖော်နားလည်မှု ဆင်တူခြင်းမှာလည်း တဖြည်းဖြည်း မြင့်တက်လာသည်ကို သူတွေ့ရှိခဲ့ရသည်။ ယင်းမှာ "Platonic representation hypothesis" က ကြိုတင်ခန့်မှန်းခဲ့သည့်အတိုင်း အတိအကျပင် ဖြစ်ပါသည်။
ဘုံတရားများကို ရှာဖွေခြင်း (Find the Universals)
အမှန်စင်စစ်တွင် အရာအားလုံးသည် ထင်သလောက် မရိုးရှင်းပါ။ ပုံဖော်နားလည်မှု ဆင်တူခြင်း (representational similarity) ကို တိုင်းတာရာတွင် ရလဒ်အပေါ် သက်ရောက်မှုရှိနိုင်သည့် စမ်းသပ်မှုဆိုင်ရာ ရွေးချယ်စရာများစွာ ရှိနေပါသည်။ ကွန်ရက်တစ်ခုစီ၏ မည်သည့်အလွှာ (layer) ကို သင်လေ့လာမည်နည်း? မော်ဒယ်တစ်ခုစီမှ ဗက်တာအစုအဖွဲ့များ ရရှိလာလျှင်ကော ၎င်းတို့ကို နှိုင်းယှဉ်ရန် များပြားလှသော သင်္ချာနည်းလမ်းများထဲမှ မည်သည့်နည်းလမ်းကို အသုံးပြုမည်နည်း? ထို့အပြင် မည်သည့် ပုံဖော်ချက်များကို အရင်ဆုံး တိုင်းတာမည်နည်း?
"အကယ်၍ သင်က ဒေတာအစုအဝေး တစ်ခုတည်းကိုပဲ စမ်းသပ်မယ်ဆိုရင် ရလဒ်က တခြားနေရာတွေမှာ ဘယ်လောက်အထိ အကျုံးဝင်မလဲဆိုတာ သင်သေချာမသိနိုင်ပါဘူး" ဟု ဘာသာစကားမော်ဒယ်များရှိ ပုံဖော်နားလည်မှု ဆင်တူခြင်းကို လေ့လာနေသည့် ချီကာဂိုတက္ကသိုလ်မှ သုတေသီ Christopher Wolfram က ပြောကြားခဲ့သည်။ "ပိုပြီး ထူးဆန်းတဲ့ ဒေတာအစုအဝေးတွေနဲ့ စမ်းသပ်ကြည့်ရင် ဘာဖြစ်မလဲဆိုတာ ဘယ်သူသိနိုင်မလဲ?"
Isola ကလည်း ဤကိစ္စမှာ ပြတ်ပြတ်သားသား အဖြေမထွက်သေးကြောင်း ဝန်ခံထားပါသည်။ ၎င်းမှာ စာတမ်းတစ်စောင်တည်းနှင့် ဖြေရှင်း၍ရသည့် မေးခွန်းမျိုးမဟုတ်ပါ။ အခြေခံအားဖြင့် မော်ဒယ်များက မည်သည့်ပုံ သို့မဟုတ် မည်သည့်ဝါကျကိုမဆို ပုံဖော်ပုံကို တိုင်းတာနိုင်သည်။ သူ၏အမြင်အရ မော်ဒယ်များအကြား တူညီမှု (convergence) ကို ပြသနေသည့် အခြေအနေများသည် တူညီမှုမရှိသည့် အခြေအနေများထက် ပို၍ စိတ်ဝင်စားစရာကောင်းသည်ဟု ဆိုသည်။
"သိပ္ပံပညာရဲ့ ကြိုးပမ်းအားထုတ်မှုဆိုတာ ဘုံတရား (universals truths) တွေကို ရှာဖွေဖို့ပဲ ဖြစ်ပါတယ်" ဟု Isola က ပြောသည်။ "မော်ဒယ်တွေ တစ်ခုနဲ့တစ်ခု ဘယ်လိုကွဲပြားသလဲ၊ ဘယ်လိုသဘောထားကွဲလွဲသလဲဆိုတာကို လေ့လာလို့ရပေမဲ့ အဲဒါက ဘုံတူညီချက်တွေကို ရှာဖွေဖော်ထုတ်တာလောက်တော့ အဖြေတစ်ခုကို ရှင်းပြနိုင်စွမ်း မရှိပါဘူး။"
အခြားသော သုတေသီများကမူ မော်ဒယ်များ၏ ပုံဖော်နားလည်မှုများ "ကွဲပြားသည့်နေရာ" ကို အာရုံစိုက်ခြင်းက ပို၍ အကျိုးရှိသည်ဟု ငြင်းဆိုကြသည်။ ထိုသူများထဲတွင် MIT အဖွဲ့ဝင် ၄ ဦးအနက် ၃ ဦး၏ အကြံပေးပုဂ္ဂိုလ်ဖြစ်ခဲ့သူ ကာလီဖိုးနီးယားတက္ကသိုလ် (Berkeley) မှ သုတေသီ Alexei Efros လည်း ပါဝင်သည်။
"သူတို့အားလုံးဟာ ကျွန်တော့်ရဲ့ သူငယ်ချင်းကောင်းတွေဖြစ်သလို အရမ်းကို တော်ကြတဲ့သူတွေပါ" ဟု Efros က ဆိုသည်။ "ကျွန်တော်ကတော့ သူတို့မှားနေတယ်လို့ ထင်တယ်၊ ဒါပေမဲ့ ဒါဟာ သိပ္ပံပညာရဲ့ သဘောသဘာဝပါပဲ။"
Efros က ထောက်ပြသည်မှာ Huh အသုံးပြုခဲ့သည့် Wikipedia ဒေတာအစုအဝေးတွင် ပါဝင်သော ပုံများနှင့် စာသားများသည် မူလကတည်းက ဆင်တူသောအချက်အလက်များကို ဖော်ပြရန် ရည်ရွယ်ထားခြင်းဖြစ်သည်ဟု ဆိုသည်။ သို့သော် ကမ္ဘာပေါ်တွင် ကျွန်ုပ်တို့တွေ့ကြုံနေရသော ဒေတာအများစုမှာ ဘာသာပြန်ရန် ခက်ခဲသော အသွင်အပြင်များ ရှိနေပါသည်။ "စာရင်းဇယားတစ်ခုတည်းကို ဖတ်မနေဘဲ အနုပညာပြတိုက်ကို ကိုယ်တိုင်သွားကြည့်ရတဲ့ အကြောင်းရင်းတစ်ခု ရှိပါတယ်" ဟု သူက ဆိုသည်။
မော်ဒယ်များကြားရှိ အတွင်းပိုင်း တူညီမှုသည် အသုံးဝင်ရန်အတွက် "တစ်ထပ်တည်း" တူညီနေဖို့ မလိုပါ။ ပြီးခဲ့သည့် နွေရာသီက သုတေသီများသည် ဘာသာစကားမော်ဒယ်တစ်ခု၏ အတွင်းပိုင်း ဝါကျပုံဖော်ချက်များကို အခြားမော်ဒယ်တစ်ခုသို့ ဘာသာပြန်ပြောင်းလဲပေးနိုင်သည့် နည်းလမ်းတစ်ခုကို တီထွင်ခဲ့ကြသည်။ အကယ်၍ ဘာသာစကားမော်ဒယ်နှင့် အမြင်အာရုံမော်ဒယ်တို့၏ ပုံဖော်ချက်များသည် တစ်ခုနှင့်တစ်ခု အစားထိုး၍ရနိုင်သည်ဆိုပါက ၎င်းသည် ဒေတာအမျိုးအစား နှစ်မျိုးလုံးမှ သင်ယူနိုင်သည့် မော်ဒယ်အသစ်များကို လေ့ကျင့်ပေးရန် နည်းလမ်းသစ်များ ဖြစ်ပေါ်လာစေနိုင်ပါသည်။
ဤကဲ့သို့ အလားအလာရှိသော တိုးတက်မှုများ ရှိနေသော်လည်း အခြားသော သုတေသီများကမူ မည်သည့် သီအိုရီတစ်ခုတည်းကမျှ ခေတ်သစ် AI မော်ဒယ်များ၏ အပြုအမူကို အပြည့်အဝ ဖော်ပြနိုင်လိမ့်မည် မဟုတ်ဟု ထင်မြင်ကြသည်။
"ပါရာမီတာပေါင်း ထရီလီယံချီရှိတဲ့ စနစ်တစ်ခုကို ရိုးရှင်းတဲ့ ရှင်းပြချက်တွေနဲ့ အနှစ်ချုပ်လို့ မရပါဘူး" ဟု British Columbia တက္ကသိုလ်မှ AI သုတေသီ Jeff Clune က ပြောကြားခဲ့သည်။ "အဖြေတွေက ရှုပ်ထွေးနေပါလိမ့်မယ်။"
Source -
Is the inside of a vision model at all like a language model? Researchers argue that as the models grow more powerful, they may be converging toward a singular “Platonic” way to represent the world.