

കണ്ടന്റ് ക്രിയേറ്റഴ്സിനെ സംബന്ധിച്ച് എഐ ടൂൾസ് ഒരു വലിയ അനുഗ്രഹമാണ്. ഭാവനയിൽ കണ്ട ഒരു രംഗം വർണാഭമായ ഒരു ചിത്രമാക്കാനും, മനസ്സിൽ വന്ന ഒരു ഈണം ഒരു മുഴുനീള പാട്ട് ആക്കാനും, കൈവശമുള്ള ചിത്രം ഉജ്ജ്വലമായൊരു വീഡിയോ ആക്കാനുമെല്ലാം എഐ സഹായിക്കുന്നു. ഇത്തവണ നമ്മൾ പരിചയപ്പെടാൻ പോകുന്ന എഐ ടൂൾ ഒരു ജഗജില്ലിയാണ്. ഒരു പക്ഷെ കണ്ടന്റ് ക്രിയേറ്റഴ്സിനെ സംബന്ധിച്ച് ഏറ്റവും അനുഗ്രഹം ആയേക്കാവുന്ന ഒന്ന്. പേര്: ഇലവൻ ലാബ്സ്.
ഇലവൻ ലാബ്സ് 2022-ൽ പിയോട്ടർ ഡാബ്കോവ്സ്കിയും മാറ്റി സ്റ്റാനിസ്വെസ്കിയും ചേർന്ന് ആരംഭിച്ച, യുഎസ് ആസ്ഥാനമായുള്ള ഒരു വോയ്സ് എഐ പ്ലാറ്റ്ഫോമാണ്. ടെക്സ്റ്റിൽ നിന്ന് വളരെ യാഥാർത്ഥ്യബോധമുള്ളതും വൈകാരികതയുമുള്ള മനുഷ്യശബ്ദം ഉണ്ടാക്കുന്ന ഒരു ടെക്സ്റ്റ്-ടു-സ്പീച്ച് (ടിടിഎസ്) സാങ്കേതികവിദ്യയാണ് ഇലവൻ ലാബ്സ് മുന്നോട്ട് വയ്ക്കുന്നത്. ഡീപ് ലേണിങ്ങിലൂടെ ഇത് നിങ്ങൾക്ക് വേണ്ടി വോയ്സ് സിന്തസിസും, വോയ്സ് ക്ലോണിങ്ങും ചെയ്യുന്നു. ഇതിൽ സൗജന്യമായി ചെയ്യാനാകുന്നതും പണം നൽകിയാൽ അധിക ഫീച്ചേഴ്സ് ലഭിക്കുന്ന പ്ലാനും ലഭ്യമാണ്.
കമ്പ്യൂട്ടറിനെ "സംസാരിപ്പിക്കുന്നതിനെയാണ്" വോയ്സ് സിന്തസിസ് എന്ന് പറയുന്നത്. നിങ്ങൾ എന്തെങ്കിലും വാചകം ടൈപ്പ് ചെയ്യുമ്പോൾ, കമ്പ്യൂട്ടർ അത് ഒരു കൃത്രിമ ശബ്ദം ഉപയോഗിച്ച് ഉച്ചത്തിൽ വായിക്കുന്നു. ഇത് മനുഷ്യ ശബ്ദത്തിന്റെ റെക്കോർഡിങ്ങുകൾ പുനരുപയോഗിക്കുന്നതല്ല, മറിച്ച് എഐ ഉപയോഗിച്ച് ശബ്ദം സൃഷ്ടിച്ചെടുക്കുകയാണ്, അതിനാൽ നിങ്ങൾ നൽകുന്ന ഏത് വാചകവും ഇതിന് പറയാൻ കഴിയും. ചുരുക്കി പറഞ്ഞാൽ നിങ്ങൾ ഉണ്ടാക്കുന്ന കണ്ടന്റിന് നിങ്ങളുടെ ശബ്ദം തന്നെ ഉപയോഗിക്കണമെന്നില്ല. എഐ നിർമിക്കുന്ന ഒരു കൃത്രിമ ശബ്ദം നൽകാൻ കഴിയും.
വോയ്സ് ക്ലോണിങ് എന്നാൽ ഒരു യഥാർത്ഥ വ്യക്തിയുടെ ശബ്ദം പകർത്തുക എന്നാണ്. ഒരു ചെറിയ ഓഡിയോ സാമ്പിൾ നൽകിയാൽ (ഉദാഹരണത്തിന് ആരെങ്കിലും സംസാരിക്കുന്നതിന്റെ ഒന്ന് മുതൽ അഞ്ച് മിനിറ്റ് വരെ ദൈർഘ്യം ഉള്ള ഒരു റെക്കോർഡിങ്), ആ വ്യക്തിയുടെ ശബ്ദം അനുകരിക്കാൻ എഐയ്ക്ക് കഴിയും. നിങ്ങളുടെ സ്വന്തം ശബ്ദത്തിൽ ഒരു ഖണ്ഡിക വായിക്കുന്ന ഒരു റെക്കോർഡിങ് കൊടുത്താൽ, നിങ്ങളുടെ ശബ്ദം പുനർസൃഷ്ടിച്ച് എഐ ഒരു മുഴുവൻ പുസ്തകവും വായിക്കും.
ഇലവൻ ലാബ്സ് ഉപയോഗിക്കുന്ന നൂതനമായ സാങ്കേതിക വിദ്യ ഉപയോഗിച്ച് ഒരു മനുഷ്യന്റെ സംസാരത്തെ കൃത്യമായി പകർത്താൻ സാധിക്കും. സംസാരത്തിന്റെ ടോൺ, വികാരം, ഇൻഫ്ലക്ഷൻ എന്നിവ ഉൾപ്പെടുന്ന സൂക്ഷ്മതകൾ എല്ലാം എഐ സൃഷ്ടിക്കും. ശബ്ദം അതേപടി മാത്രം പകർത്താതെ ഇതിൽ നിങ്ങളുടെ ഇഷ്ടാനുസൃത സ്വഭാവസവിശേഷതകളുള്ള (ഉദാ. പ്രായം, ലിംഗഭേദം, ടോൺ) സവിശേഷമായ സിന്തറ്റിക് ശബ്ദങ്ങൾ രൂപകൽപ്പന ചെയ്യാനും സാധിക്കും.
റോബോട്ടിക് അല്ലെങ്കിൽ അസ്വാഭാവികമായി തോന്നുന്ന പഴയ ടിടിഎസ് സിസ്റ്റങ്ങൾ പോലെയല്ല, ഇലവൻ ലാബ്സ് സൃഷ്ടിക്കുന്ന ശബ്ദങ്ങൾ യഥാർത്ഥ മനുഷ്യ റെക്കോർഡിങ്ങുകളിൽ നിന്ന് വേർതിരിച്ചറിയാൻ ഏതാണ്ട് അസാധ്യമാണ്. അവരുടെ ഏറ്റവും പുതിയ മോഡലായ v3- യിൽ എഴുപതിലധികം (70+) ഭാഷകൾ ഉപയോഗിക്കാൻ സാധിക്കും. ഇത് ആഗോള തലത്തിൽ ഇലവൻ ലാബ്സിന്റെ പ്രശസ്തി വർധിപ്പിച്ചിട്ടുണ്ട്.
അതിനായി ആദ്യം ഇലവൻലാബ്സ് വെബ്സൈറ്റ് സന്ദർശിച്ച് സൈൻഅപ്പ് ചെയ്യുക. അത് തന്നെ നിങ്ങളോട് ചോദിക്കും നിങ്ങൾക്ക് ഇലവൻലാബ്സ് കൊണ്ട് എന്തൊക്കെ ഉണ്ടാക്കാനാണ് താല്പര്യം എന്ന്.
ഒടുവിൽ അത് നമ്മളെ മെയിൻ പേജിൽ കൊണ്ടെത്തിക്കും. അതിൽ നിങ്ങൾക്ക് ഇഷ്ടമുള്ള ശബ്ദം തിരഞ്ഞെടുക്കാനും, അതിൽ തന്നെ മറ്റ് വ്യത്യാസങ്ങൾ വരുത്തി പരീക്ഷിക്കാനും സാധിക്കും. തത്കാലം ഇതിന്റെ പവർ കാണിച്ചു തരാൻ ആശാനെ കൊണ്ട് നമുക്ക് മലയാളത്തിൽ തന്നെ സംസാരിപ്പിച്ചു കളയാം. ഇതിന്റെ പുതിയ വേർഷൻ മലയാളം സപ്പോട്ട് ചെയ്യുന്നുണ്ട്. ഇതിൽ ഓഡിയോ ടാഗുകൾ നൽകാനും ഓപ്ഷൻ ഉണ്ട്, അതായത് ഒരു വരി പറഞ്ഞു കഴിഞ്ഞ് ഒന്ന് ചിരിക്കാനോ, നെടുവീർപ്പ് ഇടാനോ ഒക്കെ പറയാം. ഞാൻ നൽകിയ സ്ക്രിപ്റ്റ് ഇതാണ്:
ഇനി ഇത് നൽകിയ ഓഡിയോ കേൾക്കണോ? (എന്റെ ശബ്ദം അല്ല കേട്ടോ! തത്കാലം എന്റെ ശബ്ദം എന്റെ ഉടമസ്ഥതയിൽ തന്നെ ഇരിക്കട്ടെ!)
ഇലവൻ ലാബ്സിന് പലവിധ ഉപയോഗങ്ങൾ ഉണ്ട്. ഡെവലപ്പർമാർക്കും കണ്ടന്റ് ക്രിയേറ്റഴ്സിനും മറ്റും വീഡിയോകൾ, ആപ്പുകൾ, ഗെയിമുകൾ, ഓഡിയോബുക്കുകൾ, മറ്റ് ഡിജിറ്റൽ പ്രൊഡക്ടുകൾ എന്നിവയിലേക്ക് ഇലവൻ ലാബ്സിനെ സംയോജിപ്പിക്കാൻ കഴിയും. കൂടാതെ നിരവധി വ്യവസായങ്ങളിൽ ഇലവൻ ലാബ്സ് വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്നുണ്ട്. എഴുത്തുകാർക്കും പ്രസാധകർക്കും ഓഡിയോബുക്കുകൾ ഉണ്ടാക്കാൻ, ബഹുഭാഷാ റിലീസുകൾക്കായി സിനിമകളിലും പരമ്പരകളിലും ഡബ്ബ് ചെയ്യാൻ, അനിമേറ്റഡ് കഥാപാത്രങ്ങൾക്കുള്ള ശബ്ദം ഉണ്ടാക്കാൻ, കാഴ്ച പരിമിതിയുള്ളവരെ സഹായിക്കുന്ന ടൂളുകൾ ഉണ്ടാക്കാൻ, ടിക് ടോക്ക് /യൂട്യൂബ് പോലുള്ള പ്ലാറ്റ്ഫോമുകളിൽ മാർക്കറ്റിങ്ങിനും, സോഷ്യൽ മീഡിയ ഉള്ളടക്കവും മറ്റും ഉണ്ടാക്കാനുമെല്ലാം നിലവിൽ ഇത് ഉപയോഗിക്കപ്പെടുന്നുണ്ട്.
ഇലവൻ ലാബ്സിന്റെ വോയ്സ് സിന്തസിസ്, ക്ലോണിങ് തുടങ്ങിയ ഉന്നത സാങ്കേതികവിദ്യകൾ ആവേശകരമായ സാധ്യതകൾ മുന്നോട്ട് വെക്കുമ്പോഴും, ചില ഗുരുതരമായ ധാർമ്മിക പ്രശ്നങ്ങളും ഉയർത്തുന്നുണ്ട്. ഏറ്റവും വലിയ പ്രശ്നം ശബ്ദം പുനർസൃഷ്ടിച്ച് ആളുകളെ തെറ്റിദ്ധരിപ്പിക്കാം എന്നതാണ്. ഡീപ്ഫേക്ക് ഓഡിയോ ഉപയോഗിച്ച് വ്യാജവാർത്തകൾ പ്രചരിപ്പിക്കാനും, സാമ്പത്തിക തട്ടിപ്പിന് ഉപയോഗിക്കാനും, ആരെയെങ്കിലും അനുകരിച്ച് അവരുടെ കുടുംബത്തെയോ സുഹൃത്തുക്കളെയോ തെറ്റിദ്ധരിപ്പിക്കാനുമുള്ള സാധ്യതകളും ഇതിൽ ഒളിഞ്ഞുകിടപ്പുണ്ട്. ഒരു പ്രശസ്തനായ വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്ത്, അവർ പറഞ്ഞിട്ടില്ലാത്ത കാര്യങ്ങൾ പറഞ്ഞതായി കാണിച്ചാൽ എന്തായിരിക്കും ഫലം? ഇത് അവരുടെ പ്രതിച്ഛായയെയും നശിപ്പിക്കും.
കൂടാതെ മറ്റൊരു ആശങ്കക്കും ഇത് വഴിവെക്കുന്നുണ്ട്. ഒരു വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്താൽ അതിന്റെ ഉടമസ്ഥത പിന്നെ ആർക്കാണ്? അനുമതി കൂടാതെ ശബ്ദം ഉപയോഗിക്കാതിരിക്കാൻ എന്ത് ചെയ്യാൻ കഴിയും? പകർപ്പവകാശ നിയമങ്ങളുടെ കീഴിൽ ഇത് വരുമോ? ഇതുകൂടാതെ, വോയ്സ് ആക്ടിങ്, ഓഡിയോബുക്ക് സൃഷ്ടി, കസ്റ്റമർ സർവീസ് പോലുള്ള തൊഴിൽ മേഖലകളിൽ മനുഷ്യർക്ക് പകരം എഐ ഉപയോഗിക്കുന്നത് വഴി ഉണ്ടാകുന്ന തൊഴിൽ നഷ്ടം ആര് നികത്തും? ചോദ്യങ്ങൾ അവസാനിക്കുന്നില്ല.
ഈ പ്രശ്നങ്ങൾക്കുള്ള പരിഹാരമായി ഇലവൻലാബ്സ് വാട്ടർമാർക്കിങ്, വോയ്സ് വെരിഫിക്കേഷൻ തുടങ്ങിയ സുരക്ഷാ സംവിധാനങ്ങൾ കൊണ്ടുവന്നെങ്കിലും, കൃത്രിമ ബുദ്ധിയുടെ വളർച്ചയെക്കാൾ വേഗത്തിൽ നിയമനിർമാണവും സാമൂഹിക അവബോധവുമെല്ലാം നടപ്പിലായില്ലെങ്കിൽ ഇത് ചൂഷണം ചെയ്യാനുള്ള ഒരു ഉപകരണമായി മാറും.
Subscribe to our Newsletter to stay connected with the world around you
Follow Samakalika Malayalam channel on WhatsApp
Download the Samakalika Malayalam App to follow the latest news updates