Graphics Generated by Midjourny AI

ChatGPT യും
​ബോധജ്ഞാനവും

ചാറ്റ്ജിപിടി മനുഷ്യരുമായി പെട്ടെന്ന് ഇടപഴകും, വിസ്തൃതമായ ആഖ്യാനങ്ങൾ കാഴ്ച വെയ്ക്കും എന്നൊക്കെയുള്ള പുതുമ അതിനെ സർവ്വസ്വീകാര്യതയിൽ എത്തിച്ചു എന്നേയുള്ളൂ. ബോധജ്ഞാനത്തിലേക്കുള്ള കമ്പ്യൂട്ടർ കുതിപ്പിന്റെ ലക്ഷണമൊന്നുമല്ല.

ബോധജ്ഞാനം എന്താണെന്നുള്ളതിന്​ കൃത്യമായ പ്രായോഗിക, ന്യൂറോണൽ പരമായ നിർവ്വചനം ഇല്ല. ന്യൂറോൺ വലയങ്ങളുടെ പ്രവർത്തനങ്ങളാൽ വികാരങ്ങൾ ഉളവാകുന്നത് എങ്ങനെയെന്നതിന്​ വിവരണങ്ങളുണ്ട്​ എന്നത്​സത്യമാണെങ്കിലും ന്യൂറോണുകളും ന്യൂറോണുകളും തമ്മിൽ ഘടിപ്പിക്കപ്പെടുമ്പോൾ അത് ബോധമായി രൂപാന്തരപ്പെടുന്നത് എങ്ങനെയെന്നതിൽ ഒരു പൊതുതീർപ്പ് ശാസ്ത്രജ്ഞർക്കിടയിലുണ്ടായിട്ടില്ല. മനസ്സ് ശരീരത്തിൽ നിന്ന് വേർപെട്ടതാണോ? ബാഹ്യമായ ചോദനകൾ വഴിയല്ലെങ്കിലും തലച്ചോറ് പ്രവർത്തിക്കുന്നില്ലെ? കാഴ്ച നഷ്ട​പ്പെട്ടവർക്കും മായവിഭ്രമം വഴിയോ അല്ലാതെയോ വസ്തുക്കൾ കാണുന്നതായി അനുഭവിക്കപ്പെടുന്നുണ്ടല്ലോ? പരിസരങ്ങളുമായി ബന്ധം വേണമോ ബോധം ഉദിയ്ക്കാൻ? ഈ ചോദ്യങ്ങൾ പണ്ടേ തന്നെ വേദാന്തികളെ ആകർഷിച്ചിരുന്നു, അവർ ഇന്നും സിദ്ധാന്തങ്ങളുമായി എത്തുന്നുണ്ട്. എന്നാൽ ബോധജ്ഞാനസംബന്ധിയായ ആധുനിക ശാസ്ത്രവികാസപരിണാമങ്ങൾ ,പ്രത്യേകിച്ചും ന്യൂറോ ശാസ്ത്രം, ന്യൂറോ സർജറി, ന്യൂറോ എൻജിനീറിങ്ങ് എന്നിവയിലേത് വേദാന്തികളുടെ ചാരുകസേരയിൽ നിന്ന് ഈ തത്വശസ്ത്രത്തെ പരീക്ഷണശാലകളിലും ക്ലിനിക്കുകളിലും എത്തിച്ചിരിക്കയാണ്.

കമ്പ്യൂട്ടറുകൾക്ക് മനുഷ്യമനസ്സിനെ അനുകരിക്കാമെന്നത് ബോധജ്ഞാനത്തെക്കുറിച്ച് ആഴത്തിലുള്ള ചോദ്യങ്ങൾ ചോദിക്കാൻ പ്രേരിപ്പിക്കുന്നുണ്ട്. മനുഷ്യമസ്തിഷ്‌ക്കത്തിന്​ സാധിക്കാത്തതു പലതും കമ്പ്യൂട്ടറുകൾ ചെയ്യുകയാണ്. എന്നാൽ പായസത്തിന്റെ രുചി അറിയാനോ ഒരു ആലിംഗനത്തിന്റെ നിർവൃതി അനുഭവപ്പെടാനോ അതിനു സാദ്ധ്യമാണോ? തൽക്കാലം അല്ല തന്നെ. ബുദ്ധി എന്താണെന്ന് ശാസ്ത്രനിപുണരിൽ അഭിപ്രായവ്യത്യാസമുണ്ടെങ്കിലും അതിന്റെ ചില പ്രായോഗികത തീർച്ചയായും പ്രകടിപ്പിക്കുന്നുണ്ട്, ഈ ആധുനിക യന്ത്രങ്ങൾ. ശരിക്കും അതിബുദ്ധിയുള്ള യന്ത്രമാണെങ്കിൽ അതിന്​ ബോധജ്ഞാനമുളവാകാനും സാദ്ധ്യതയില്ലെ? ഉണ്ടെന്നുള്ള അനുമാനം ഹോളിവുഡ് സിനിമകളിൽ (ബ്‌ളേഡ് റണ്ണർ, ഹെർ, എക്‌സ് മാക്കിന മുതലയാവ) നമ്മൾ കണ്ടനുഭവിച്ചതാണ്, ഇത്തരം ഭാവനകൾ യാഥാർഥ്യമാകുന്നുണ്ടെന്ന് ചരിത്രം ഉദ് ഘോഷിക്കുന്നുമുണ്ട്. മറ്റുള്ളവരുടെ മനോരീതികൾ നമ്മൾ മനസ്സിലാക്കെയെടുക്കുന്ന ‘തിയറി ഓഫ് മൈൻഡ്' പ്രതിഭാസം ആധുനിക കമ്പ്യൂട്ടറുകൾ സ്വായത്തമാക്കിയിട്ടുണ്ട്. ബോധജ്ഞാനത്തെ അപഗ്രഥിക്കുന്ന രണ്ട് സിദ്ധാന്തങ്ങൾ നിലവിലുണ്ട്. Global neuronal workspace (GNW) theory, Integrated Information Theory (IIT) എന്നിവ. ഇവയിൽ ചില പൊതുഘടകങ്ങൾ വീക്ഷിക്കാമെങ്കിലും കൃത്യമായ പ്രയോഗസത്യം തിരിച്ചറിയാൻ പ്രയാസമുണ്ട്.

കൃത്രിമ ന്യൂറൽ വലയങ്ങൾ (Artificial Neural Networks)

തലച്ചോറിലെ ന്യൂറോൺ -ന്യൂറോൺ ബന്ധപ്പെടലുകളാണ് വലയങ്ങൾ തീർത്ത് തലച്ചോറിന്റെ വിവിധ പ്രവർത്തനങ്ങൾക്ക് ആധാരമാകുന്നത്. കൃത്രിമമാണെങ്കിലും കമ്പ്യൂട്ടർ നിർമ്മിച്ചെടുക്കുന്ന ഏകകങ്ങൾക്ക് ‘ന്യൂറോൺ' എന്നുതന്നെയാണ് പേർ. മസ്തിഷ്‌ക്കവലയങ്ങൾ പോലെ ഇവ വലയങ്ങൾ തീർക്കുകയാണ്. വിവരങ്ങൾ പകർന്നുകിട്ടുന്ന (input) ന്യൂറോണുകളും അതിൽ നിന്ന്​ ഉത്പന്നമാകുന്ന (output) ന്യൂറോണുകളും തമ്മിൽ ഒരു അസ്ത്രചിഹ്നം കൊണ്ട് സൂചിപ്പിക്കാം. ഈ ബന്ധങ്ങളിൽ ഓരോന്നിനും ഓരോ നിശ്ചിത മാർഗമുണ്ട് (Directed edges). കൂടാതെ നിശ്ചിത ഭാരവും (Weights). പലപട്ടണങ്ങളിൽ നിന്ന് മറ്റ് പട്ടണങ്ങളിലേക്കുള്ള വിമാനമാർഗ്ഗം സൂചിപ്പിക്കുന്ന വലക്കണ്ണീഭൂപടം പോലെയാണിത്. യാത്രയ്ക്ക് ആവശ്യം വരുന്ന തുകയാണ് ആ മാർഗത്തിന്റെ ഭാരം. ഇത് ന്യൂറോണുകൾ തമ്മിലുള്ള സംവേദനങ്ങളുടെ തീക്ഷ്ണതയ്ക്ക് സമാനമാണ്. കൃത്രിമ ന്യൂറൽ വലയങ്ങൾ ബാഹ്യലോകത്തിൽനിന്ന് സംവേദനങ്ങൾ സ്വീകരിക്കുകയും (ഒരു പൂച്ചയുടെ ചിത്രം സ്‌കാൻ ചെയ്തത് അല്ലെങ്കിൽ ഒരു പ്രത്യേക പാറ്റേൺ കമ്പ്യൂട്ടറിൽ ചേർക്കുക) ഓരോ ന്യൂറോൺ ബന്ധങ്ങളും അവയുടെ ഭാരം അനുസരിച്ച് മറ്റ് ഉൽപ്പന്ന ന്യൂറോണുകളിൽ വിവരം കൈമാറുകയും അവ ഒരു അറിവ് വെളിവാക്കുകയും (ഇത് പൂച്ചയുടെ ചിത്രമാണ് എന്ന്) ചെയ്യുകയാണ്. ഈ രണ്ട് സംഘങ്ങളും അടരുകളായാണ് സംവിധാനം ചെയ്തിരിക്കുന്നത്, അതുകൊണ്ട് സങ്കീർണവുമാണ്. ഇവക്കുരണ്ടിനും ഇടയിൽ മറയ്ക്കപ്പെട്ട അടരുകളുമുണ്ട് (hidden layers). ഈ അടര് input ഉം output ഉം തമ്മിൽ ബന്ധിപ്പിക്കുകയാണ്. ഇത് പഠിച്ചെടുക്കൽ പ്രക്രിയുടെ അടിസ്ഥാനമാണ്. എന്നുവെച്ചാൽ പിന്നെ പൂച്ചയുടെ ആകൃതി എവിടെ കണ്ടാലും തിരിച്ചറിയാൻ പ്രാപ്തി നേടുകയാണ്.

സാധാരണ കൃത്രിമ ന്യൂറൽ വലയങ്ങളിൽ ഇൻപുട്ടിൽ നിന്ന് ഔട്ട്​പുട്ടിലേക്ക്​ ഒരു ദിശയിൽ മാത്രമാണ് സംവേദനം. പക്ഷേ ഇപ്പോൾ മുൻപോട്ടും പിറകോട്ടും ഇത് സാധിച്ചെടുക്കുന്ന സമ്പ്രദായം വന്നു ചേർന്നിട്ടുണ്ട്. ‘പുനരാവർത്തിയായ ന്യൂറൽ വലയങ്ങൾ’ (Recurrent Neural Network, RNN) എന്നാണിതിന്റെ പേര്.

‘Deep learning' വാസ്തവത്തിൽ ന്യൂറൽ വലയങ്ങളാണ്. ‘ആഴം' എന്നത് ഈ വലയങ്ങളിൽ മേൽച്ചൊന്നപോലെ മൂന്നു അടരുകൾ മാത്രം അല്ല, പല അടരുകളുണ്ടെന്ന്​ സൂചിപ്പിക്കുന്നു. വലിയ ഡാറ്റാ സെറ്റു (data set) കളിൽ മനുഷ്യന്റെ ഇടപെടലുകൾ ആവശ്യമായി വരും input, output ഒക്കെ ക്രമീകരിക്കാൻ. ഇതില്ലാതാക്കപ്പെട്ടിരിക്കയാണ് ഡീപ് ലേണിങ്ങിൽ. അതുകൊണ്ട് അസംഖ്യം ഡാറ്റാ സെറ്റുകൾ ഒരുമിച്ച് കൈകാര്യം ചെയ്ത് നെല്ലും പതിരും വേർതിരിക്കുക സാദ്ധ്യമാവുകയാണ്. ആഖ്യാനമോ വിഷയവസ്തുവോ പ്രതിരൂപങ്ങളോ ചിത്രങ്ങളോ അതേപടി സ്വാംശീകരിച്ച് അർത്ഥം പൊരുൾ തിരിക്കുകയാണ്.

ബ്രഹത്​ ഭാഷാമാതൃക ( Large Language Model- LLM)

ഇഷ്ടം പോലെ ആഖ്യാനങ്ങൾ നിർമിച്ചെടുക്കുന്ന ChatGPT പോലുള്ള ചാറ്റ്‌ബോട്ടുകൾ ബ്രഹ്​ത്​ ഭാഷാമാതൃക എന്ന സിസ്റ്റത്തിന്മേൽ നിർമ്മിച്ചെടുത്തവയാണ്. ഭാഷ പഠിപ്പിച്ചെടുക്കുന്നതുപോലെ വാക്കുകളും വാചകങ്ങളും ചിഹ്നങ്ങളും കൊണ്ട് പരിശീലനം ചെയ്യപ്പെട്ടവയാണിവ. പഠിച്ചെടുത്തത് ഉപയോഗിക്കാൻ പ്രാപ്തമാണ് ഈ സിസ്​റ്റം. ആർട്ടിഫിഷ്യൽ ഇൻറലിജൻസിലെ വൻ പുരോഗമനസൂചകം. ഭാഷ എന്നത് അന്യോന്യ സംവേദനത്തിനപ്പുറം ഉപയോഗിക്കപ്പെടാവുന്നതാണ്. കമ്പ്യൂട്ടറിന്റെ ഭാഷയാണ് ‘കോഡ്'. പ്രോട്ടീനും ഡി.എൻ.എ അനുക്രമങ്ങളും (sequences) ജീവശാസ്ത്രത്തിന്റെ കോഡ് ആയിരിക്കുന്നപോലെ. ഭാഷയുടെ പൊതുനിയമങ്ങൾ ഉപയോഗിച്ച് ഇവയിലൊക്കെ സംവേദനം സാദ്ധ്യമാണ്. ഡീപ് ലേണീങ്ങിന്റെ സങ്കീർണ കണക്കുപടികൾ (ആൽഗൊരിതം) ഇവിടെ ഉപയോഗിക്കപ്പെടുകയാണ്. പടുകൂറ്റൻ ഡാറ്റാ സെറ്റുകൾ ഉപയോഗിച്ച്, അതിലെ വ്യാഖ്യാനങ്ങൾ പൊരുൾ തിരിച്ച് സമ്മാനിക്കുകയാണ് ഈ ബ്രഹത്​ ഭാഷാമാതൃക. എളുപ്പത്തിൽ തിരിച്ചറിഞ്ഞ്, ചുരുക്കിയെടുത്ത്, പരിഭാഷപ്പെടുത്തി, പ്രവചിച്ച് ആഖ്യാനങ്ങൾ വിരചിക്കപ്പെടുകയാണ് ഈ വിദ്യ മൂലം. നിർമ്മിച്ചെടുക്കാനും നിലനിർത്താനും ദുഷ്‌ക്കരമാണെങ്കിലും ഓരോ വർഷവും പത്തിരട്ടി വലിപ്പമാണ് ഈ LLM സ്വായത്തമാക്കുന്നത്.

ചാറ്റ് ജിപിറ്റി ലോഗോ
ചാറ്റ് ജിപിറ്റി ലോഗോ

ചാറ്റ്ജിപിടി എന്ന പുതിയ കുട്ടി

ബ്രഹത്​ ഭാഷാമാതൃക (LLM) യുടെ ഏറ്റവും പുതിയ കുഞ്ഞാണ് ചാറ്റ്ജിപിടി. നമ്മൾ പറഞ്ഞുകൊടുക്കുന്ന വിഷയങ്ങളിൽ കഥയും കവിതയും നാടകവും സിനിമാ സ്‌ക്രിപ്റ്റും എഴുതുന്ന പ്രതിഭ. പ്രിയതരമായി നർമ്മസംഭാഷണങ്ങളിൽ ഏർപ്പെടുന്ന നിർമല മനസ്സ്. പക്ഷേ തെറ്റുകളിലേക്ക് വഴുതുവീഴുമെന്ന ദോഷം ഉണ്ട്. കണക്കുചോദ്യങ്ങളിൽ ഉത്തരം പാളിപ്പോകുന്നു. യുക്തിചിന്തകളിലും ന്യായവാദങ്ങളിലും പതർച്ച. ആൾജിബ്ര ചോദ്യത്തിന്​ ചാറ്റ്ജിപിടി തെറ്റായ ഉത്തരമാണ് തന്നത്. ഹൈസ്‌കൂൾ ലെവലിലുള്ള കണക്കു പരീക്ഷയിൽ 26% മാർക്ക് മാത്രമേ കിട്ടിയുള്ളു പാവം ചാറ്റ്ജിപിടിയ്ക്ക്. പരിശീലനസമയ്ത്ത് ലഭിച്ചത് സ്വരൂപിച്ച്, സ്റ്റാറ്റിസ്റ്റിക്‌സ് അനുസരിച്ച് ക്രമപ്പെടുത്തിയതാണ്, കിട്ടിയ വാക്കുകൾ, വാചകങ്ങൾ ചിഹ്നങ്ങൾ ഒക്കെ ഉപയോഗിച്ചാൽ ഇത്രയ്‌ക്കൊക്കെയേ വരൂ.

എന്നാൽ 2022- ലിറങ്ങിയ ഗൂഗിളിന്റെ ‘മിനെർവ' എന്നു പേരിട്ട LLM 50% മാർക്ക് വാങ്ങിച്ചിരുന്നു, ഇതേ കണക്ക് പരീക്ഷയിൽ. മിനർവയുടെ വലിപ്പം വളരെ കൂടുതലായിരുന്നു എന്നതാണ് ഇതിന്റെ പിന്നിലെ സത്യം. ഉപയോഗിച്ച മാനദണ്ഡങ്ങൾ (parameters) പലമടങ്ങ് കൂടുതലാണ് ചാറ്റ്ജിപിടിയെക്കാൾ. 175 ബില്ല്യൺ മാനദണ്ഡങ്ങളാണ് ചാറ്റ്ജിപിടി ഉപയോഗിച്ചതെങ്കിൽ മിനർവ ഉപയോഗിച്ചത് ഗൂഗിളിന്റെ PaLM LLM പോലെ മറ്റൊരു സിസ്​റ്റം (Pathways Language Model) ആണ്. 540 മില്ല്യൻ മാന്ദണ്ഡങ്ങൾ ഉൾപ്പെടുത്തിയത്. മാത്രമല്ല, പരിശീലിപ്പിച്ചത് 780 ബില്ല്യൻ ടോക്കണുകളുടെ (ഒരു വാക്കോ അക്കമോ ഒരു നിശ്ചിതവിവരത്തിന്റെ യൂണിറ്റോ ആകാം ടോക്കൺ) കൂമ്പാരത്തിൽ നിന്നുമാണ്.

മനുഷ്യമസ്തിഷ്‌ക്കം; എന്തു സാമർത്ഥ്യം!

ഏത് LLM -നേക്കാളും അതിസങ്കീർണവും വലിപ്പമേറിയതുമാണ്​ നമ്മുടെ തലച്ചോറ്. 86 ബില്ല്യൻ ന്യൂറോണുകൾ, 100 ട്രില്ല്യൺ ന്യൂറോൺ- ന്യൂറോൺ ഘടിപ്പിക്കൽ ഒക്കെയാണ് തലങ്ങും വിലങ്ങും സംവേദനങ്ങൾ പായിയ്ക്കുന്നത്. കമ്പ്യൂട്ടർ സിസ്റ്റമുകൾ ഉപയോഗിയ്ക്കുന്നതിന്റെ ഒരു അംശം വൈദ്യുതി മാത്രമാണ് മസ്തിഷ്‌കം ഉപയോഗിക്കുന്നത്: 20 മുതൽ 50 വാട്ട് (Watt) വരെ മാത്രം. ഇപ്പോഴുള്ള വെല്ലുവിളി ഇതാണ്: തലച്ചോറിന്റെ സ്വഭാവത്തെ കൂടുതൽ അനുകരിക്കുന്ന ഭാഷാമാതൃകയും മറ്റ് ന്യൂറൽ വലയങ്ങളും ആവിഷ്‌ക്കരിക്കുക, ചെറുതും കൂടുതൽ സാമർത്ഥ്യമിയന്നതും കാര്യക്ഷമമേറിയതും ആയിരിക്കും അത്.

നമ്മുടെ തലച്ചോറിന്റെ ആകപ്പാടെയുള്ള ബുദ്ധിശക്തിയുടേയും കാര്യക്ഷമതയുടെഉം ഒരു ഉറവിടം അതിന്റെ പുനരാവർത്തി (recurrent) സ്വഭാവമാണ്, സംവേദനത്തിന്റെ ഉറവിടങ്ങളിലേയ്ക്ക് പ്രതികരണം അറിയിക്കുന്ന feedback ബന്ധങ്ങളാണ്. LLM കളാവട്ടെ ഒരേ ദിശയിൽ മാത്രമുള്ള feedforward നെറ്റ് വർക്കുകളാണ്. ഇതിനർത്ഥം സംസൂചനകൾ ഇൻപുട്ടിൽ നിന്ന് മേൽച്ചൊന്ന അടരുകളിൽ കൂടി ഔട്ട്​ പുട്ടിലേക്കെത്തുക മാത്രമാണെന്നാണ്. മസ്തിഷ്‌ക്ക ‘വയറിങ്ങ്' വ്യത്യാസമിയന്നതാണ്. ഉദാഹരണത്തിന്​, മനുഷ്യരുടെ കാഴ്ചാവ്യവസ്ഥ (visual system) യിൽ തലച്ചോറിൽ ആദ്യം ലഭിയ്ക്കുന്ന ദൃഷ്ടിസംവേദനങ്ങളുമായി ഒരു പറ്റം ന്യൂറോണുകൾ തലച്ചോറിന്റെ പിറകുഭാഗത്തേയ്ക്ക് വിവരങ്ങളുമായി പായുകയാണ്. ഉടൻ പ്രതികരണങ്ങൾ എതിർ ദിശയിൽ സഞ്ചരിച്ച് ഉറവിടസ്ഥാനത്ത് അറിയിപ്പുകളായി എത്തിയ്ക്കും. അങ്ങോട്ട് കൊണ്ടുപോയതിൽ പത്തിരട്ടി വിവരങ്ങളായിരിക്കും ഈ ‘feedback' സഞ്ചാരപഥത്തിൽ അടങ്ങിയിരിക്കുന്നത്.

മുൻപോട്ടും പിറകോട്ടൂം സംവേദനങ്ങൾ സാദ്ധ്യമാക്കുന്ന, ‘feedforward, feedback ഘടിപ്പിക്കലുകൽ ഉള്ളവ ‘പുനരാവർത്തി ന്യൂറൽ വലയങ്ങൾ’ (RNN) ആണെന്ന് മേൽ പ്രസ്താവിച്ചു കഴിഞ്ഞു. ഇത്തരം നെറ്റ് വർക്കുകൾ (കേവലം മുൻപോട്ട് മാത്രം സംവേദനം നടത്തുന്ന LLM കളിൽ ഇല്ലാത്തത്) ഡാറ്റായിലുള്ള ക്രമരൂപങ്ങൾ കാലാനുസൃതമായി മാറിയാലും അത് കണ്ടുപിടിയ്ക്കാൻ പ്രാപ്തരാണ്. പ്രകൃത്യായുള്ള ബുദ്ധിശക്തികൾ ലോകത്തെ അറിയുന്നതിന്റേയും പഠിച്ചെടുക്കുന്നതിന്റേയും സർവ്വാടിസ്ഥാനം ഇതാണ്. പക്ഷേ നിർമ്മിതബുദ്ധിയിലെ ഈ RNN കളെ പരിശീലിപ്പിച്ചെടുക്കാൻ എളുപ്പമല്ല, സാവധാനമേ സാധിയ്ക്കൂ. അതുകൊണ്ട് നിലവിലുള്ള ബ്രഹത്​ ഭാഷാ മാതൃകകളുടെ വലിപ്പത്തിലേക്ക് വീർപ്പിച്ചെടുക്കാൻ എളുപ്പമല്ല. നമ്മുടെ ന്യൂറോണുകൾ കാര്യക്ഷമതയോടെ വർത്തിക്കുന്നതിനു മറ്റൊരു കാരണവുമുണ്ട്. അവ മിക്കവാറും നിശ്ശബ്ദമാണ്, വല്ലപ്പൊഴുമാണ് ഒരു വൈദ്യുതി വിജൃംഭണം സംഭവിക്കുന്നത്. നേരേ മറിച്ച് കൃത്രിമ ന്യൂറൽ വലയങ്ങൾ എപ്പൊഴും ഉണർച്ചയിലാണ്. തനത് തലച്ചോറിന്റെ ആൽഗൊരിതമുകൾ കൃത്രിമ ന്യൂറൽ വലയങ്ങളെ പഠിപ്പിച്ചെടുക്കാൻ വിദഗ്ധർ പണിപ്പെടുന്നുണ്ട്. പക്ഷേ മസ്തിഷ്‌ക്കത്തിന്റെ വൈദ്യുതിച്ചെലവിനേക്കാൾ വളരെ ഏറെയാണ് ആർട്ടിഫിഷ്യൽ ഇൻറലിജൻസിന്റെ LLM കൾക്ക് ആവശ്യമായി വരുന്നത്.

ഊർജ്ജസമർത്ഥത കയ്യാളുന്ന, കൂടുതൽ മിടുക്കരായ LLM കൾ ആവിഷ്‌ക്കരിക്കാൻ ഉദ്യമങ്ങൾ തുടരുന്നുണ്ട്. 2021 ഡിസംബറിൽ ഗൂഗിളിന്റെ ‘DeepMind' പ്രസ്താവിച്ചത് അവരുടെ ‘റിട്രൊ' എന്ന സിസ്​റ്റം LLM കളെ പുറമേ ഉള്ള ഒരു ഡാറ്റാബേസുമായി ബന്ധിപ്പിക്കുന്ന ഘടന പ്രാവർത്തികമാണ്, സമർത്ഥവുമാണ് എന്നാണ്. ഈ മറുഡാറ്റാബേസിൽ നിന്ന് വിവരങ്ങൾ ശേഖരിച്ച് പ്രവചനങ്ങൾ സാദ്ധ്യമാക്കുന്നത് കാര്യക്ഷമത വർദ്ധിപ്പിക്കുകയാണത്രെ.

ആർട്ടിഫിഷ്യൽ ഇൻറലിജൻസിൽനിന്ന് ബോധജ്ഞാനത്തിലേക്ക്

‘‘ചാറ്റ്ജിപിടി ഒരു മാതൃകയല്ല അതിനെക്കുറിച്ചുള്ള ചർച്ചകൾ അവകാശപ്പെടുന്നതു പോലെ. നിങ്ങൾ ഒരു പാവകളി കണ്ടുകൊണ്ടിരിക്കുമ്പോൾ അത് ജീവനുള്ളവയാണെന്ന് ധരിക്കുന്നതുപോലെയാണിത്'' ഗൂഗിളിലെ നിർമ്മിതബുദ്ധി (AI) വിദഗ്ധൻ പ്രസ്താവിച്ചതാണിത്. യുക്തിയും ന്യായവാദവും പ്രകടിപ്പിക്കുന്ന AI അസാദ്ധ്യമൊന്നുമല്ല, കൃത്രിമ ന്യൂറോണുകൾ തമ്മിലുള്ള ഘടിപ്പിക്കൽ വർദ്ധമാനവും സങ്കീർണവുമാക്കുക, കൂടുതൽ ഡാറ്റാ സമ്മാനിക്കുക ഇവയൊക്കെ സാധിച്ചെടുത്താൽ അവ യുക്തിഭദ്രമായി ഏൽപ്പിച്ച പണികൾ നിർദ്ധാരണം ചെയ്യും എന്നാണ് അനുമാനം. ഗൂഗിളിന്റെ ‘ഡീപ്‌മൈൻഡ്' ഒരു പുതിയ നിർമ്മിതബുദ്ധിയുമായി എത്തിയിട്ടുണ്ട്. ‘Adaptive Agent' അഥവാ AdA എന്ന് വിളിയ്ക്കപ്പെടുന്ന ഈ AI ആകട്ടെ 3 ഡിമെൻഷനൽ വിർച്വൽ ലോകത്ത് വ്യവഹരിക്കുന്നതാണ്. അതിനോട് പ്രത്യേക പണികൾ -വസ്തുക്കളെ മാറ്റുക, ആസൂത്രണം ചെയ്യുക ഇവയൊക്കെ ഉൾപ്പെടുന്ന - നിർദ്ധാരണം ചെയ്യാൻ ആവശ്യപ്പെട്ടാൽ സ്വയം അത് നിർവ്വഹിക്കാൻ തയാറാകുമത്രെ. നേരത്തെ പരിചയമില്ലാത്ത മേഖലകളി സധൈര്യം കയറിച്ചെല്ലുമത്രെ ഈ പുതിയ AI. നേരത്തെ പഠിച്ചെടുത്തതോ പരിചയപ്പെട്ടതോ അല്ലാത്ത ഗെയ്മുകൾ കളിച്ച് ജയിക്കുമത്രെ ഇത്. ഒരു പുതിയ പരിതസ്ഥിതിയിലെത്തിയാൽ അത് മനസ്സിലാക്കി അതനുസരിച്ച് തീരുമാനങ്ങള മാറ്റാനുള്ള കഴിവുണ്ടത്രെ ‘AdA' യ്ക്ക്.

ചാറ്റ്ജിപിടി മനുഷ്യരുമായി പെട്ടെന്ന് ഇടപഴകും, വിസ്തൃതമായ ആഖ്യാനങ്ങൾ കാഴ്ച വെയ്ക്കും എന്നൊക്കെയുള്ള പുതുമ അതിനെ സർവ്വസ്വീകാര്യതയിൽ എത്തിച്ചു എന്നേയുള്ളൂ. ബോധജ്ഞാനത്തിലേക്കുള്ള കമ്പ്യൂട്ടർ കുതിപ്പിന്റെ ലക്ഷണമൊന്നുമല്ല. പക്ഷേ മനസ്സ് ഒരു സൂപ്പർ കമ്പ്യൂട്ടറിന്റെ സ്വഭാവം കാണിയ്ക്കുന്നു എന്നതിനാൽ കമ്പ്യൂട്ടറുകൾക്ക് ആശിക്കാവുന്നതാണ്, തലച്ചോറിലെ ന്യൂറോൺ വലയങ്ങളുടെ ഘടനയും പ്രവർത്തനവും അവർക്ക് ഒരുനാൾ പ്രാപ്തമാകുമെന്ന്. ▮

References:1. Dehaene, S., Lan, H. and Kouider S. What is consciousness, and could machines have it? Science 358: 486-492 20172. Melloni L., Mudrik L., Pitts M.and Koch C. Making the hard problem of consciousness easier. Science 372: 911-912 20213. Ananthaswamy A. In AI is bigger the better? Nature 615: 202-206.2023


എതിരൻ കതിരവൻ

ജോൺസ്​ ഹോപ്​കിൻസ്​ യൂണിവേഴ്​സിറ്റിയിലും യൂണിവേഴ്​സിറ്റി ഓഫ്​ ഷിക്കാഗോയിലും സയൻറിസ്​റ്റ്​, അധ്യാപകൻ. നിരവധി ശാസ്​ത്ര, സാമൂഹ്യശാസ്​ത്ര ഗവേഷണ പ്രബന്ധങ്ങൾ എഴുതിയിട്ടുണ്ട്​. മലയാളിയുടെ ജനിതകം, സുന്ദരഗാനങ്ങൾ- അകവും പൊരുളും, സിനിമയുടെ സാമൂഹിക വെളിപാടുകൾ തുടങ്ങിയവ പ്രധാന കൃതികൾ

Comments