നിങ്ങളുടെ ശബ്ദത്തിൽ ഇനി എഐ സംസാരിക്കും, ഇലവൻലാബ്‌സിലൂടെ

ഇത് മനുഷ്യ ശബ്ദത്തിന്റെ റെക്കോർഡിങ്ങുകൾ പുനരുപയോഗിക്കുന്നതല്ല, മറിച്ച് എഐ ഉപയോഗിച്ച് ശബ്ദം സൃഷ്ടിച്ചെടുക്കുകയാണ്, അതിനാൽ നിങ്ങൾ നൽകുന്ന ഏത് വാചകവും ഇതിന് പറയാൻ കഴിയും. ചുരുക്കി പറഞ്ഞാൽ നിങ്ങൾ ഉണ്ടാക്കുന്ന കണ്ടന്റിന് നിങ്ങളുടെ ശബ്ദം തന്നെ ഉപയോഗിക്കണമെന്നില്ല. എഐ നിർമിക്കുന്ന ഒരു കൃത്രിമ ശബ്ദം നൽകാൻ കഴിയും.

AI voice synthesis cloning dubbing representative imageAI image

Updated on:

30 Jul 2025, 12:48 pm

3 min read

കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനെ സംബന്ധിച്ച് എഐ ടൂൾസ് ഒരു വലിയ അനുഗ്രഹമാണ്. ഭാവനയിൽ കണ്ട ഒരു രംഗം വർണാഭമായ ഒരു ചിത്രമാക്കാനും, മനസ്സിൽ വന്ന ഒരു ഈണം ഒരു മുഴുനീള പാട്ട് ആക്കാനും, കൈവശമുള്ള ചിത്രം ഉജ്ജ്വലമായൊരു വീഡിയോ ആക്കാനുമെല്ലാം എഐ സഹായിക്കുന്നു. ഇത്തവണ നമ്മൾ പരിചയപ്പെടാൻ പോകുന്ന എഐ ടൂൾ ഒരു ജഗജില്ലിയാണ്. ഒരു പക്ഷെ കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനെ സംബന്ധിച്ച് ഏറ്റവും അനുഗ്രഹം ആയേക്കാവുന്ന ഒന്ന്. പേര്: ഇലവൻ ലാബ്സ്.

Eleven labs, voice synthesis, text-to-speech

Eleven labsscreen shot

ചാറ്റ്ജിപിറ്റിയിൽ ഒളിഞ്ഞിരിക്കുന്ന ഈ രഹസ്യ കോഡുകൾ അറിയാമോ?

എന്താണ് ഈ ഇലവൻ ലാബ്സ്?

ഇലവൻ ലാബ്‌സ് 2022-ൽ പിയോട്ടർ ഡാബ്‌കോവ്‌സ്‌കിയും മാറ്റി സ്റ്റാനിസ്‌വെസ്‌കിയും ചേർന്ന് ആരംഭിച്ച, യുഎസ് ആസ്ഥാനമായുള്ള ഒരു വോയ്‌സ് എഐ പ്ലാറ്റ്‌ഫോമാണ്. ടെക്‌സ്റ്റിൽ നിന്ന് വളരെ യാഥാർത്ഥ്യബോധമുള്ളതും വൈകാരികതയുമുള്ള മനുഷ്യശബ്‌ദം ഉണ്ടാക്കുന്ന ഒരു ടെക്സ്റ്റ്-ടു-സ്പീച്ച് (ടിടിഎസ്) സാങ്കേതികവിദ്യയാണ് ഇലവൻ ലാബ്‌സ് മുന്നോട്ട് വയ്ക്കുന്നത്. ഡീപ് ലേണിങ്ങിലൂടെ ഇത് നിങ്ങൾക്ക് വേണ്ടി വോയ്‌സ് സിന്തസിസും, വോയ്‌സ് ക്ലോണിങ്ങും ചെയ്യുന്നു. ഇതിൽ സൗജന്യമായി ചെയ്യാനാകുന്നതും പണം നൽകിയാൽ അധിക ഫീച്ചേഴ്സ് ലഭിക്കുന്ന പ്ലാനും ലഭ്യമാണ്.

കമ്പ്യൂട്ടറിനെ "സംസാരിപ്പിക്കുന്നതിനെയാണ്" വോയ്‌സ് സിന്തസിസ് എന്ന് പറയുന്നത്. നിങ്ങൾ എന്തെങ്കിലും വാചകം ടൈപ്പ് ചെയ്യുമ്പോൾ, കമ്പ്യൂട്ടർ അത് ഒരു കൃത്രിമ ശബ്ദം ഉപയോഗിച്ച് ഉച്ചത്തിൽ വായിക്കുന്നു. ഇത് മനുഷ്യ ശബ്ദത്തിന്റെ റെക്കോർഡിങ്ങുകൾ പുനരുപയോഗിക്കുന്നതല്ല, മറിച്ച് എഐ ഉപയോഗിച്ച് ശബ്ദം സൃഷ്ടിച്ചെടുക്കുകയാണ്, അതിനാൽ നിങ്ങൾ നൽകുന്ന ഏത് വാചകവും ഇതിന് പറയാൻ കഴിയും. ചുരുക്കി പറഞ്ഞാൽ നിങ്ങൾ ഉണ്ടാക്കുന്ന കണ്ടന്റിന് നിങ്ങളുടെ ശബ്ദം തന്നെ ഉപയോഗിക്കണമെന്നില്ല. എഐ നിർമിക്കുന്ന ഒരു കൃത്രിമ ശബ്ദം നൽകാൻ കഴിയും.

വോയ്‌സ് ക്ലോണിങ് എന്നാൽ ഒരു യഥാർത്ഥ വ്യക്തിയുടെ ശബ്‌ദം പകർത്തുക എന്നാണ്. ഒരു ചെറിയ ഓഡിയോ സാമ്പിൾ നൽകിയാൽ (ഉദാഹരണത്തിന് ആരെങ്കിലും സംസാരിക്കുന്നതിന്റെ ഒന്ന് മുതൽ അഞ്ച് മിനിറ്റ് വരെ ദൈർഘ്യം ഉള്ള ഒരു റെക്കോർഡിങ്), ആ വ്യക്തിയുടെ ശബ്‌ദം അനുകരിക്കാൻ എഐയ്ക്ക് കഴിയും. നിങ്ങളുടെ സ്വന്തം ശബ്ദത്തിൽ ഒരു ഖണ്ഡിക വായിക്കുന്ന ഒരു റെക്കോർഡിങ് കൊടുത്താൽ, നിങ്ങളുടെ ശബ്ദം പുനർസൃഷ്ടിച്ച് എഐ ഒരു മുഴുവൻ പുസ്തകവും വായിക്കും.

ഇലവൻ ലാബ്സ് ഉപയോഗിക്കുന്ന നൂതനമായ സാങ്കേതിക വിദ്യ ഉപയോഗിച്ച് ഒരു മനുഷ്യന്റെ സംസാരത്തെ കൃത്യമായി പകർത്താൻ സാധിക്കും. സംസാരത്തിന്റെ ടോൺ, വികാരം, ഇൻഫ്ലക്ഷൻ എന്നിവ ഉൾപ്പെടുന്ന സൂക്ഷ്മതകൾ എല്ലാം എഐ സൃഷ്ടിക്കും. ശബ്ദം അതേപടി മാത്രം പകർത്താതെ ഇതിൽ നിങ്ങളുടെ ഇഷ്ടാനുസൃത സ്വഭാവസവിശേഷതകളുള്ള (ഉദാ. പ്രായം, ലിംഗഭേദം, ടോൺ) സവിശേഷമായ സിന്തറ്റിക് ശബ്ദങ്ങൾ രൂപകൽപ്പന ചെയ്യാനും സാധിക്കും.

റോബോട്ടിക് അല്ലെങ്കിൽ അസ്വാഭാവികമായി തോന്നുന്ന പഴയ ടിടിഎസ് സിസ്റ്റങ്ങൾ പോലെയല്ല, ഇലവൻ ലാബ്സ് സൃഷ്ടിക്കുന്ന ശബ്ദങ്ങൾ യഥാർത്ഥ മനുഷ്യ റെക്കോർഡിങ്ങുകളിൽ നിന്ന് വേർതിരിച്ചറിയാൻ ഏതാണ്ട് അസാധ്യമാണ്. അവരുടെ ഏറ്റവും പുതിയ മോഡലായ v3- യിൽ എഴുപതിലധികം (70+) ഭാഷകൾ ഉപയോഗിക്കാൻ സാധിക്കും. ഇത് ആഗോള തലത്തിൽ ഇലവൻ ലാബ്‌സിന്റെ പ്രശസ്തി വർധിപ്പിച്ചിട്ടുണ്ട്.

നിങ്ങൾക്കും എഐ ചിത്രങ്ങൾ ഉണ്ടാക്കണോ; ദാ, സിംപിളാണ് കാര്യം!

ഇലവൻ ലാബ്സ് എങ്ങനെ ഉപയോഗിക്കാം

അതിനായി ആദ്യം ഇലവൻലാബ്സ് വെബ്‌സൈറ്റ് സന്ദർശിച്ച് സൈൻഅപ്പ് ചെയ്യുക. അത് തന്നെ നിങ്ങളോട് ചോദിക്കും നിങ്ങൾക്ക് ഇലവൻലാബ്‌സ് കൊണ്ട് എന്തൊക്കെ ഉണ്ടാക്കാനാണ് താല്പര്യം എന്ന്.

eleven labs, AI voice synthesis, cloning, dubbing

eleven labscreen shot

ഒടുവിൽ അത് നമ്മളെ മെയിൻ പേജിൽ കൊണ്ടെത്തിക്കും. അതിൽ നിങ്ങൾക്ക് ഇഷ്ടമുള്ള ശബ്ദം തിരഞ്ഞെടുക്കാനും, അതിൽ തന്നെ മറ്റ് വ്യത്യാസങ്ങൾ വരുത്തി പരീക്ഷിക്കാനും സാധിക്കും. തത്കാലം ഇതിന്റെ പവർ കാണിച്ചു തരാൻ ആശാനെ കൊണ്ട് നമുക്ക് മലയാളത്തിൽ തന്നെ സംസാരിപ്പിച്ചു കളയാം. ഇതിന്റെ പുതിയ വേർഷൻ മലയാളം സപ്പോട്ട് ചെയ്യുന്നുണ്ട്. ഇതിൽ ഓഡിയോ ടാഗുകൾ നൽകാനും ഓപ്‌ഷൻ ഉണ്ട്, അതായത് ഒരു വരി പറഞ്ഞു കഴിഞ്ഞ് ഒന്ന് ചിരിക്കാനോ, നെടുവീർപ്പ് ഇടാനോ ഒക്കെ പറയാം. ഞാൻ നൽകിയ സ്ക്രിപ്റ്റ് ഇതാണ്:

11labsscreenshot

ഇനി ഇത് നൽകിയ ഓഡിയോ കേൾക്കണോ? (എന്റെ ശബ്ദം അല്ല കേട്ടോ! തത്കാലം എന്റെ ശബ്ദം എന്റെ ഉടമസ്ഥതയിൽ തന്നെ ഇരിക്കട്ടെ!)

Chinnu.avin · ElevenLabs_2025-07-24T19_13_54_Liam_pre_sp100_s50_sb75_v3

സാധ്യതകൾ പലവിധം

ഇലവൻ ലാബ്സിന് പലവിധ ഉപയോഗങ്ങൾ ഉണ്ട്. ഡെവലപ്പർമാർക്കും കണ്ടന്റ് ക്രിയേറ്റഴ്‌സിനും മറ്റും വീഡിയോകൾ, ആപ്പുകൾ, ഗെയിമുകൾ, ഓഡിയോബുക്കുകൾ, മറ്റ് ഡിജിറ്റൽ പ്രൊഡക്ടുകൾ എന്നിവയിലേക്ക് ഇലവൻ ലാബ്സിനെ സംയോജിപ്പിക്കാൻ കഴിയും. കൂടാതെ നിരവധി വ്യവസായങ്ങളിൽ ഇലവൻ ലാബ്സ് വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്നുണ്ട്. എഴുത്തുകാർക്കും പ്രസാധകർക്കും ഓഡിയോബുക്കുകൾ ഉണ്ടാക്കാൻ, ബഹുഭാഷാ റിലീസുകൾക്കായി സിനിമകളിലും പരമ്പരകളിലും ഡബ്ബ് ചെയ്യാൻ, അനിമേറ്റഡ് കഥാപാത്രങ്ങൾക്കുള്ള ശബ്ദം ഉണ്ടാക്കാൻ, കാഴ്ച പരിമിതിയുള്ളവരെ സഹായിക്കുന്ന ടൂളുകൾ ഉണ്ടാക്കാൻ, ടിക് ടോക്ക് /യൂട്യൂബ് പോലുള്ള പ്ലാറ്റ്‌ഫോമുകളിൽ മാർക്കറ്റിങ്ങിനും, സോഷ്യൽ മീഡിയ ഉള്ളടക്കവും മറ്റും ഉണ്ടാക്കാനുമെല്ലാം നിലവിൽ ഇത് ഉപയോഗിക്കപ്പെടുന്നുണ്ട്.

ചാറ്റ് ജിപിറ്റി അല്ല, അതുക്കും മേലെയാണ് ഈ പെർപ്ലെക്സിറ്റി

ധാർമ്മിക പ്രശ്നങ്ങൾ

ഇലവൻ ലാബ്സിന്റെ വോയ്സ് സിന്തസിസ്, ക്ലോണിങ് തുടങ്ങിയ ഉന്നത സാങ്കേതികവിദ്യകൾ ആവേശകരമായ സാധ്യതകൾ മുന്നോട്ട് വെക്കുമ്പോഴും, ചില ഗുരുതരമായ ധാർമ്മിക പ്രശ്നങ്ങളും ഉയർത്തുന്നുണ്ട്‌. ഏറ്റവും വലിയ പ്രശ്നം ശബ്ദം പുനർസൃഷ്ടിച്ച് ആളുകളെ തെറ്റിദ്ധരിപ്പിക്കാം എന്നതാണ്. ഡീപ്‌ഫേക്ക് ഓഡിയോ ഉപയോഗിച്ച് വ്യാജവാർത്തകൾ പ്രചരിപ്പിക്കാനും, സാമ്പത്തിക തട്ടിപ്പിന് ഉപയോഗിക്കാനും, ആരെയെങ്കിലും അനുകരിച്ച് അവരുടെ കുടുംബത്തെയോ സുഹൃത്തുക്കളെയോ തെറ്റിദ്ധരിപ്പിക്കാനുമുള്ള സാധ്യതകളും ഇതിൽ ഒളിഞ്ഞുകിടപ്പുണ്ട്. ഒരു പ്രശസ്തനായ വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്ത്, അവർ പറഞ്ഞിട്ടില്ലാത്ത കാര്യങ്ങൾ പറഞ്ഞതായി കാണിച്ചാൽ എന്തായിരിക്കും ഫലം? ഇത് അവരുടെ പ്രതിച്ഛായയെയും നശിപ്പിക്കും.

കൂടാതെ മറ്റൊരു ആശങ്കക്കും ഇത് വഴിവെക്കുന്നുണ്ട്. ഒരു വ്യക്തിയുടെ ശബ്ദം ക്ലോൺ ചെയ്താൽ അതിന്റെ ഉടമസ്ഥത പിന്നെ ആർക്കാണ്? അനുമതി കൂടാതെ ശബ്ദം ഉപയോഗിക്കാതിരിക്കാൻ എന്ത് ചെയ്യാൻ കഴിയും? പകർപ്പവകാശ നിയമങ്ങളുടെ കീഴിൽ ഇത് വരുമോ? ഇതുകൂടാതെ, വോയ്സ് ആക്ടിങ്, ഓഡിയോബുക്ക് സൃഷ്ടി, കസ്റ്റമർ സർവീസ് പോലുള്ള തൊഴിൽ മേഖലകളിൽ മനുഷ്യർക്ക് പകരം എഐ ഉപയോഗിക്കുന്നത് വഴി ഉണ്ടാകുന്ന തൊഴിൽ നഷ്ടം ആര് നികത്തും? ചോദ്യങ്ങൾ അവസാനിക്കുന്നില്ല.

ഈ പ്രശ്നങ്ങൾക്കുള്ള പരിഹാരമായി ഇലവൻലാബ്‌സ് വാട്ടർമാർക്കിങ്, വോയ്സ് വെരിഫിക്കേഷൻ തുടങ്ങിയ സുരക്ഷാ സംവിധാനങ്ങൾ കൊണ്ടുവന്നെങ്കിലും, കൃത്രിമ ബുദ്ധിയുടെ വളർച്ചയെക്കാൾ വേഗത്തിൽ നിയമനിർമാണവും സാമൂഹിക അവബോധവുമെല്ലാം നടപ്പിലായില്ലെങ്കിൽ ഇത് ചൂഷണം ചെയ്യാനുള്ള ഒരു ഉപകരണമായി മാറും.

Eleven Labs is an AI voice synthesis platform that creates highly realistic, human-like speech using advanced deep learning models. Let’s learn how to use it