നിങ്ങളുടെ ശബ്ദത്തിൽ ഇനി എഐ സംസാരിക്കും, ഇലവൻലാബ്‌സിലൂടെ

ഇത് മനുഷ്യ ശബ്ദത്തിന്റെ റെക്കോർഡിങ്ങുകൾ പുനരുപയോഗിക്കുന്നതല്ല, മറിച്ച് എഐ ഉപയോഗിച്ച് ശബ്ദം സൃഷ്ടിച്ചെടുക്കുകയാണ്, അതിനാൽ നിങ്ങൾ നൽകുന്ന ഏത് വാചകവും ഇതിന് പറയാൻ കഴിയും. ചുരുക്കി പറഞ്ഞാൽ നിങ്ങൾ ഉണ്ടാക്കുന്ന കണ്ടന്റിന് നിങ്ങളുടെ ശബ്ദം തന്നെ ഉപയോഗിക്കണമെന്നില്ല. എഐ നിർമിക്കുന്ന ഒരു കൃത്രിമ ശബ്ദം നൽകാൻ കഴിയും.
AI voice synthesis, cloning, dubbing
AI voice synthesis cloning dubbing representative imageAI image
Updated on
3 min read

കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനെ സംബന്ധിച്ച് എഐ ടൂൾസ് ഒരു വലിയ അനുഗ്രഹമാണ്. ഭാവനയിൽ കണ്ട ഒരു രംഗം വർണാഭമായ ഒരു ചിത്രമാക്കാനും, മനസ്സിൽ വന്ന ഒരു ഈണം ഒരു മുഴുനീള പാട്ട് ആക്കാനും, കൈവശമുള്ള ചിത്രം ഉജ്ജ്വലമായൊരു വീഡിയോ ആക്കാനുമെല്ലാം എഐ സഹായിക്കുന്നു. ഇത്തവണ നമ്മൾ പരിചയപ്പെടാൻ പോകുന്ന എഐ ടൂൾ ഒരു ജഗജില്ലിയാണ്. ഒരു പക്ഷെ കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനെ സംബന്ധിച്ച് ഏറ്റവും അനുഗ്രഹം ആയേക്കാവുന്ന ഒന്ന്. പേര്: ഇലവൻ ലാബ്സ്.

Eleven labs, voice synthesis, text-to-speech
Eleven labsscreen shot
AI voice synthesis, cloning, dubbing
ചാറ്റ്ജിപിറ്റിയിൽ ഒളിഞ്ഞിരിക്കുന്ന ഈ രഹസ്യ കോഡുകൾ അറിയാമോ?

എന്താണ് ഈ ഇലവൻ ലാബ്സ്?

ഇലവൻ ലാബ്‌സ് 2022-ൽ പിയോട്ടർ ഡാബ്‌കോവ്‌സ്‌കിയും മാറ്റി സ്റ്റാനിസ്‌വെസ്‌കിയും ചേർന്ന് ആരംഭിച്ച, യുഎസ് ആസ്ഥാനമായുള്ള ഒരു വോയ്‌സ് എഐ പ്ലാറ്റ്‌ഫോമാണ്. ടെക്‌സ്റ്റിൽ നിന്ന് വളരെ യാഥാർത്ഥ്യബോധമുള്ളതും വൈകാരികതയുമുള്ള മനുഷ്യശബ്‌ദം ഉണ്ടാക്കുന്ന ഒരു ടെക്സ്റ്റ്-ടു-സ്പീച്ച് (ടിടിഎസ്) സാങ്കേതികവിദ്യയാണ് ഇലവൻ ലാബ്‌സ് മുന്നോട്ട് വയ്ക്കുന്നത്. ഡീപ് ലേണിങ്ങിലൂടെ ഇത് നിങ്ങൾക്ക് വേണ്ടി വോയ്‌സ് സിന്തസിസും, വോയ്‌സ് ക്ലോണിങ്ങും ചെയ്യുന്നു. ഇതിൽ സൗജന്യമായി ചെയ്യാനാകുന്നതും പണം നൽകിയാൽ അധിക ഫീച്ചേഴ്സ് ലഭിക്കുന്ന പ്ലാനും ലഭ്യമാണ്.

കമ്പ്യൂട്ടറിനെ "സംസാരിപ്പിക്കുന്നതിനെയാണ്" വോയ്‌സ് സിന്തസിസ് എന്ന് പറയുന്നത്. നിങ്ങൾ എന്തെങ്കിലും വാചകം ടൈപ്പ് ചെയ്യുമ്പോൾ, കമ്പ്യൂട്ടർ അത് ഒരു കൃത്രിമ ശബ്ദം ഉപയോഗിച്ച് ഉച്ചത്തിൽ വായിക്കുന്നു. ഇത് മനുഷ്യ ശബ്ദത്തിന്റെ റെക്കോർഡിങ്ങുകൾ പുനരുപയോഗിക്കുന്നതല്ല, മറിച്ച് എഐ ഉപയോഗിച്ച് ശബ്ദം സൃഷ്ടിച്ചെടുക്കുകയാണ്, അതിനാൽ നിങ്ങൾ നൽകുന്ന ഏത് വാചകവും ഇതിന് പറയാൻ കഴിയും. ചുരുക്കി പറഞ്ഞാൽ നിങ്ങൾ ഉണ്ടാക്കുന്ന കണ്ടന്റിന് നിങ്ങളുടെ ശബ്ദം തന്നെ ഉപയോഗിക്കണമെന്നില്ല. എഐ നിർമിക്കുന്ന ഒരു കൃത്രിമ ശബ്ദം നൽകാൻ കഴിയും.

വോയ്‌സ് ക്ലോണിങ് എന്നാൽ ഒരു യഥാർത്ഥ വ്യക്തിയുടെ ശബ്‌ദം പകർത്തുക എന്നാണ്. ഒരു ചെറിയ ഓഡിയോ സാമ്പിൾ നൽകിയാൽ (ഉദാഹരണത്തിന് ആരെങ്കിലും സംസാരിക്കുന്നതിന്റെ ഒന്ന് മുതൽ അഞ്ച് മിനിറ്റ് വരെ ദൈർഘ്യം ഉള്ള ഒരു റെക്കോർഡിങ്), ആ വ്യക്തിയുടെ ശബ്‌ദം അനുകരിക്കാൻ എഐയ്ക്ക് കഴിയും. നിങ്ങളുടെ സ്വന്തം ശബ്ദത്തിൽ ഒരു ഖണ്ഡിക വായിക്കുന്ന ഒരു റെക്കോർഡിങ് കൊടുത്താൽ, നിങ്ങളുടെ ശബ്ദം പുനർസൃഷ്ടിച്ച് എഐ ഒരു മുഴുവൻ പുസ്തകവും വായിക്കും.

ഇലവൻ ലാബ്സ് ഉപയോഗിക്കുന്ന നൂതനമായ സാങ്കേതിക വിദ്യ ഉപയോഗിച്ച് ഒരു മനുഷ്യന്റെ സംസാരത്തെ കൃത്യമായി പകർത്താൻ സാധിക്കും. സംസാരത്തിന്റെ ടോൺ, വികാരം, ഇൻഫ്ലക്ഷൻ എന്നിവ ഉൾപ്പെടുന്ന സൂക്ഷ്മതകൾ എല്ലാം എഐ സൃഷ്ടിക്കും. ശബ്ദം അതേപടി മാത്രം പകർത്താതെ ഇതിൽ നിങ്ങളുടെ ഇഷ്ടാനുസൃത സ്വഭാവസവിശേഷതകളുള്ള (ഉദാ. പ്രായം, ലിംഗഭേദം, ടോൺ) സവിശേഷമായ സിന്തറ്റിക് ശബ്ദങ്ങൾ രൂപകൽപ്പന ചെയ്യാനും സാധിക്കും.

റോബോട്ടിക് അല്ലെങ്കിൽ അസ്വാഭാവികമായി തോന്നുന്ന പഴയ ടിടിഎസ് സിസ്റ്റങ്ങൾ പോലെയല്ല, ഇലവൻ ലാബ്സ് സൃഷ്ടിക്കുന്ന ശബ്ദങ്ങൾ യഥാർത്ഥ മനുഷ്യ റെക്കോർഡിങ്ങുകളിൽ നിന്ന് വേർതിരിച്ചറിയാൻ ഏതാണ്ട് അസാധ്യമാണ്. അവരുടെ ഏറ്റവും പുതിയ മോഡലായ v3- യിൽ എഴുപതിലധികം (70+) ഭാഷകൾ ഉപയോഗിക്കാൻ സാധിക്കും. ഇത് ആഗോള തലത്തിൽ ഇലവൻ ലാബ്‌സിന്റെ പ്രശസ്തി വർധിപ്പിച്ചിട്ടുണ്ട്.

AI voice synthesis, cloning, dubbing
നിങ്ങൾക്കും എഐ ചിത്രങ്ങൾ ഉണ്ടാക്കണോ; ദാ, സിംപിളാണ് കാര്യം!

ഇലവൻ ലാബ്സ് എങ്ങനെ ഉപയോഗിക്കാം

അതിനായി ആദ്യം ഇലവൻലാബ്സ് വെബ്‌സൈറ്റ് സന്ദർശിച്ച് സൈൻഅപ്പ് ചെയ്യുക. അത് തന്നെ നിങ്ങളോട് ചോദിക്കും നിങ്ങൾക്ക് ഇലവൻലാബ്‌സ് കൊണ്ട് എന്തൊക്കെ ഉണ്ടാക്കാനാണ് താല്പര്യം എന്ന്.

eleven labs, AI voice synthesis, cloning, dubbing
eleven labscreen shot

ഒടുവിൽ അത് നമ്മളെ മെയിൻ പേജിൽ കൊണ്ടെത്തിക്കും. അതിൽ നിങ്ങൾക്ക് ഇഷ്ടമുള്ള ശബ്ദം തിരഞ്ഞെടുക്കാനും, അതിൽ തന്നെ മറ്റ് വ്യത്യാസങ്ങൾ വരുത്തി പരീക്ഷിക്കാനും സാധിക്കും. തത്കാലം ഇതിന്റെ പവർ കാണിച്ചു തരാൻ ആശാനെ കൊണ്ട് നമുക്ക് മലയാളത്തിൽ തന്നെ സംസാരിപ്പിച്ചു കളയാം. ഇതിന്റെ പുതിയ വേർഷൻ മലയാളം സപ്പോട്ട് ചെയ്യുന്നുണ്ട്. ഇതിൽ ഓഡിയോ ടാഗുകൾ നൽകാനും ഓപ്‌ഷൻ ഉണ്ട്, അതായത് ഒരു വരി പറഞ്ഞു കഴിഞ്ഞ് ഒന്ന് ചിരിക്കാനോ, നെടുവീർപ്പ് ഇടാനോ ഒക്കെ പറയാം. ഞാൻ നൽകിയ സ്ക്രിപ്റ്റ് ഇതാണ്:

eleven labs, AI, voice synthesis, cloning, dubbing
11labsscreenshot

ഇനി ഇത് നൽകിയ ഓഡിയോ കേൾക്കണോ? (എന്റെ ശബ്ദം അല്ല കേട്ടോ! തത്കാലം എന്റെ ശബ്ദം എന്റെ ഉടമസ്ഥതയിൽ തന്നെ ഇരിക്കട്ടെ!)

സാധ്യതകൾ പലവിധം

ഇലവൻ ലാബ്സിന് പലവിധ ഉപയോഗങ്ങൾ ഉണ്ട്. ഡെവലപ്പർമാർക്കും കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനും മറ്റും വീഡിയോകൾ, ആപ്പുകൾ, ഗെയിമുകൾ, ഓഡിയോബുക്കുകൾ, മറ്റ് ഡിജിറ്റൽ പ്രൊഡക്ടുകൾ എന്നിവയിലേക്ക് ഇലവൻ ലാബ്സിനെ സംയോജിപ്പിക്കാൻ കഴിയും. കൂടാതെ നിരവധി വ്യവസായങ്ങളിൽ ഇലവൻ ലാബ്സ് വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്നുണ്ട്. എഴുത്തുകാർക്കും പ്രസാധകർക്കും ഓഡിയോബുക്കുകൾ ഉണ്ടാക്കാൻ, ബഹുഭാഷാ റിലീസുകൾക്കായി സിനിമകളിലും പരമ്പരകളിലും ഡബ്ബ് ചെയ്യാൻ, അനിമേറ്റഡ് കഥാപാത്രങ്ങൾക്കുള്ള ശബ്ദം ഉണ്ടാക്കാൻ, കാഴ്ച പരിമിതിയുള്ളവരെ സഹായിക്കുന്ന ടൂളുകൾ ഉണ്ടാക്കാൻ, ടിക് ടോക്ക് /യൂട്യൂബ് പോലുള്ള പ്ലാറ്റ്‌ഫോമുകളിൽ മാർക്കറ്റിങ്ങിനും, സോഷ്യൽ മീഡിയ ഉള്ളടക്കവും മറ്റും ഉണ്ടാക്കാനുമെല്ലാം നിലവിൽ ഇത് ഉപയോഗിക്കപ്പെടുന്നുണ്ട്.

AI voice synthesis, cloning, dubbing
ചാറ്റ് ജിപിറ്റി അല്ല, അതുക്കും മേലെയാണ് ഈ പെർപ്ലെക്സിറ്റി

ധാർമ്മിക പ്രശ്നങ്ങൾ

ഇലവൻ ലാബ്സിന്റെ വോയ്സ് സിന്തസിസ്, ക്ലോണിങ് തുടങ്ങിയ ഉന്നത സാങ്കേതികവിദ്യകൾ ആവേശകരമായ സാധ്യതകൾ മുന്നോട്ട് വെക്കുമ്പോഴും, ചില ഗുരുതരമായ ധാർമ്മിക പ്രശ്നങ്ങളും ഉയർത്തുന്നുണ്ട്‌. ഏറ്റവും വലിയ പ്രശ്നം ശബ്ദം പുനർസൃഷ്ടിച്ച് ആളുകളെ തെറ്റിദ്ധരിപ്പിക്കാം എന്നതാണ്. ഡീപ്‌ഫേക്ക് ഓഡിയോ ഉപയോഗിച്ച് വ്യാജവാർത്തകൾ പ്രചരിപ്പിക്കാനും, സാമ്പത്തിക തട്ടിപ്പിന് ഉപയോഗിക്കാനും, ആരെയെങ്കിലും അനുകരിച്ച് അവരുടെ കുടുംബത്തെയോ സുഹൃത്തുക്കളെയോ തെറ്റിദ്ധരിപ്പിക്കാനുമുള്ള സാധ്യതകളും ഇതിൽ ഒളിഞ്ഞുകിടപ്പുണ്ട്. ഒരു പ്രശസ്തനായ വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്ത്, അവർ പറഞ്ഞിട്ടില്ലാത്ത കാര്യങ്ങൾ പറഞ്ഞതായി കാണിച്ചാൽ എന്തായിരിക്കും ഫലം? ഇത് അവരുടെ പ്രതിച്ഛായയെയും നശിപ്പിക്കും.

കൂടാതെ മറ്റൊരു ആശങ്കക്കും ഇത് വഴിവെക്കുന്നുണ്ട്. ഒരു വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്താൽ അതിന്റെ ഉടമസ്ഥത പിന്നെ ആർക്കാണ്? അനുമതി കൂടാതെ ശബ്ദം ഉപയോഗിക്കാതിരിക്കാൻ എന്ത് ചെയ്യാൻ കഴിയും? പകർപ്പവകാശ നിയമങ്ങളുടെ കീഴിൽ ഇത് വരുമോ? ഇതുകൂടാതെ, വോയ്സ് ആക്ടിങ്, ഓഡിയോബുക്ക് സൃഷ്ടി, കസ്റ്റമർ സർവീസ് പോലുള്ള തൊഴിൽ മേഖലകളിൽ മനുഷ്യർക്ക് പകരം എഐ ഉപയോഗിക്കുന്നത് വഴി ഉണ്ടാകുന്ന തൊഴിൽ നഷ്ടം ആര് നികത്തും? ചോദ്യങ്ങൾ അവസാനിക്കുന്നില്ല.

ഈ പ്രശ്നങ്ങൾക്കുള്ള പരിഹാരമായി ഇലവൻലാബ്‌സ് വാട്ടർമാർക്കിങ്, വോയ്സ് വെരിഫിക്കേഷൻ തുടങ്ങിയ സുരക്ഷാ സംവിധാനങ്ങൾ കൊണ്ടുവന്നെങ്കിലും, കൃത്രിമ ബുദ്ധിയുടെ വളർച്ചയെക്കാൾ വേഗത്തിൽ നിയമനിർമാണവും സാമൂഹിക അവബോധവുമെല്ലാം നടപ്പിലായില്ലെങ്കിൽ ഇത് ചൂഷണം ചെയ്യാനുള്ള ഒരു ഉപകരണമായി മാറും.

Eleven Labs is an AI voice synthesis platform that creates highly realistic, human-like speech using advanced deep learning models. Let’s learn how to use it

Subscribe to our Newsletter to stay connected with the world around you

Follow Samakalika Malayalam channel on WhatsApp

Download the Samakalika Malayalam App to follow the latest news updates 

Related Stories

No stories found.
X
logo
Samakalika Malayalam - The New Indian Express
www.samakalikamalayalam.com