چگونه هشت ثانیه صدای ضبط‌ شده روی یک نوار خش‌دار وی‌اِچ‌اِس، صدای مادری را به او بازگرداند

سارا اِزیکی‌یِل لبخند می‌زند، زنی با موهای جوگندمی، مجعد تا روی شانه‌هایش است و عینکی با قاب مشکی به چشم دارد
توضیح تصویر، سارا اِزیکی‌یِل، زنی با موهای جوگندمی، مجعد تا روی شانه‌هایش و عینکی با قاب مشکی
    • نویسنده, بث رز
    • شغل, بی‌بی‌سی

سارا اِزیکی‌یِل در گفت‌وگو با بی‌بی‌سی می‌گوید: ««پس از این همه سال، دیگر صدایم را به‌خاطر نمی‌آوردم. وقتی دوباره آن را شنیدم، نزدیک بود گریه کنم. واقعاً چیزی شبیه معجزه بود.»

سارا تنها چند ماه پس از تولد دومین فرزندش به «بیماری نورون حرکتی» مبتلا شد؛ بیماری‌ که در سی‌وچهار سالگی صدایش و توانایی حرکت دستانش را از او گرفت.

فرزندانش، آویوا و اریک، دوران کودکی و نوجوانی خود را تنها با صدای رباتیک و بی‌احساس دستگاهی گذراندند که جای صدای واقعی مادرشان را گرفته بود.

اکنون، پس از گذشت ۲۵ سال، هوش مصنوعی توانسته تنها با هشت ثانیه صدای ضبط‌شده روی یک نوار خش‌دار قدیمی وی‌اِچ‌اِس، صدای واقعی مادرشان را بازسازی کند.

سارا اکنون با کمک فناوری «ردیابی نگاه» با دیگران صحبت می‌کند؛ سیستمی که با دوربین حرکت چشم‌های او را هنگام نگاه به حروف روی صفحه دنبال می‌کند.

و حالا صدای سال‌های جوانی‌اش دوباره طنین‌انداز می‌شود.

آغاز این معجزه به زمانی برمی‌گردد که شرکت «اسمارت‌باکس» که فعال حوزه فناوری‌های کمکی فعال است، از سارا خواست یک ساعت نمونه صوتی در اختیارشان بگذارد تا بتوانند صدایش را بازسازی کنند.

سارا و فرزندانش که اکنون بزرگسال‌اند، به دنبال هر گونه فایل صوتی مناسب گشتند؛ اما سارا در سال ۲۰۰۰ صدایش را از دست داده بود که هنوز گوشی‌های هوشمند فراگیر نشده بودند و شبکه‌های اجتماعی لحظات را ثبت نمی‌کردند.

سرانجام خانواده نوار قدیمی وی‌اِچ‌اِس‌ای پیدا کردند که دوران نوزادی آویوا را نشان می‌داد؛ نواری خانگی از دهه ۱۹۹۰. اما تصویر لرزان بود و صدا مخدوش؛ افراد حاضر در فیلم زیر لب حرف می‌زدند و صدایشان در برابر صدای بلند تلویزیون گم می‌شد.

تنها هشت ثانیه از صدای سارا به‌سختی و با کیفیتی بد شنیده می‌شد.

عکسی خانوادگی که در دهه نود میلادی از سارا و دو فرزندش گرفته شده است. آنها روی یک مبل طرح‌دار با رنگ‌های پاییزی نشسته‌اند. سارا پسر نوپایش را روی زانوانش و دخترش را کنارش نشانده است

منبع تصویر، Sarah Ezekiel

توضیح تصویر، تصویری از اریک و آویوا در کودکی. آن‌ها هیچ خاطره‌ای از صدای مادرشان ندارند

سارا، زنی پرجنب‌وجوش از لندن، به‌عنوان دستیار شخصی در حوزه نشر کار می‌کرد تا این‌که زندگی‌اش ناگهان دگرگون شد.

سارا و همسرش که یک کودک نوپا داشتند، در انتظار تولد فرزند دومشان بودند. اما سارا حال خوبی نداشت؛ گفتارش کند شده بود و در بازوی چپش احساس ضعف می‌کرد.

به‌طور غیرمنتظره تشخیص داده شد که او به بیماری نورون حرکتی (MND) مبتلاست، که گاهی به آن اسکلروز جانبی آمیوتروفیک (ALS) نیز گفته می‌شود.

این بیماری پیش‌رونده و فرسایشی باعث ضعف و تحلیل عضلانی می‌شود و به گفته سازمان خدمات ملی بهداشت بریتانیا، از میان هزار نفری که هر سال در این کشور به آن مبتلا می‌شوند، بیشترشان توانایی صحبت کردن را از دست خواهند داد.

بیماری نورون حرکتی در مردان شایع‌تر است و ممکن است طول عمر را کوتاه کند، اما سیر آن در هر فرد متفاوت است و برخی بیماران با وجود ابتلا، سال‌های زیادی زندگی می‌کنند.

سارا می‌گوید: «در ابتدا انکار می‌کردم و فکر می‌کردم مشکلی نخواهم داشت، اما پس از تولد اریک، حال من به‌سرعت وخیم شد.»

در عرض چند ماه، سارا ابتدا توانایی استفاده از دستانش را از دست داد و در پی آن صحبت کردنش هم دیگر قابل فهم نبود. کمی بعد، زندگی مشترکش نیز از هم فروپاشید.

او می‌گوید: «افسردگی شدیدی داشتم و از ناتوانی و مرگ می‌ترسیدم.» سارا که باید از دو کودک خردسال مراقبت می‌کرد، مجبور شد به کمک ۲۴ ساعته دیگران متکی باشد.

او در کنار آویوا و اریک نشسته و می‌گوید: «دیدن اینکه غریبه‌ها از فرزندانم مراقبت می‌کنند برایم دشوار بود، اما در عین حال سپاسگزار آن‌ها هستم.»

سارا که نمی‌توانست حرکت کند و به‌سختی ارتباط برقرار می‌کرد، با تنهایی و انزوا دست و پنجه نرم می‌کرد. او می‌گوید پنج سال اول را به تماشای برنامه‌های تلویزیونی بی‌کیفیت و دیدن بزرگ شدن فرزندانش گذراند.

اریک، که اکنون ۲۵ ساله است، می‌گوید تنها خاطره‌اش «فلج بودن مامان» است، و آویوا، ۲۸ ساله، از لحظه‌ای می‌گوید که متوجه شد مادرش با دیگران فرق دارد.

«یادم هست یک بار از او خواستم چند توت‌فرنگی آماده کند، اما نتوانست آن‌ها را ببرد و مجبور شد از کسی کمک بگیرد.»

یک نقاشی انتزاعی از زنی از گردن به بالا، که چانه‌اش رو به بالا و چشمانش بسته است. قرمز رنگ غالب است و رنگ‌های درهم در بخش بالای نقاشی که چهره زن را آشفته کرده است

منبع تصویر، Sarah Ezekiel

توضیح تصویر، توانایی دوباره نقاشی کردن، باعث شد سارا «بسیار خوشحال شود، حتی اگر کار طاقت‌فرسا و خسته‌کننده‌ای بود»

نخستین روزنهٔ امید برای برقراری ارتباط دوباره برای سارا، پنج سال پس از تشخیص بیماری و با معرفی فناوری «ردیابی نگاه» گشوده شد.

به کمک این فناوری، سارا توانست تنها با حرکت چشم، کلمه و جمله بسازد و هرچند با صدای مصنوعی‌اش، مانند استیون هاوکینگ، دوباره سخن بگوید.

با کمک این فناوری، سارا توانست به‌عنوان داوطلب در «انجمن نورون حرکتی» فعالیت کند و حامی خیریه «لایفلایتس» شود؛ نهادی که هدفش فراهم کردن فناوری برای کودکان و خانواده‌هاست تا بتوانند با دیگران ارتباط برقرار کنند.

او بار دیگر به عشق اصلی‌اش، نقاشی، روی آورد و با کمک فناوری ردیابی نگاه، آثار هنری تازه‌ای خلق کرد.

او می‌گوید: «بسیار خوشحال بودم، حتی اگر این کار طاقت‌فرسا و خسته‌کننده بود.»

سایمون پول از شرکت اسمارت‌باکس در بریستول می‌گوید، با وجود آن‌که از او خواسته بود یک فایل صوتی یک‌ ساعته در اختیارش بگذارد، تنها هشت ثانیه صدا از یک نوار وی‌اِچ‌اِس به دستش رسید، و قلبش سرشار از ناامیدی شد.

او می‌گوید: «با شنیدن آن هشت ثانیه خش‌دار، مطمئن بودم غیرممکن است بتوانیم صدای واقعی بسازیم.»

با وجود تردیدها، او شروع به آزمایش کرد؛ صدای ضعیف را بارها تکرار کرد و از فناوری پیشرفته شرکت بین‌المللی تولید صدای هوش مصنوعی به نام «اِلِوِن‌لَبز» برای پردازش آن بهره گرفت.

این شرکت اعلام کرده بود که قصد دارد امکان «شبیه‌سازی صدا» را به‌صورت رایگان در اختیار یک میلیون نفر قرار دهد که به‌دلیل بیماری‌هایی مانند نورون حرکتی، سرطان یا سکته مغزی در معرض از دست دادن توانایی گفتار هستند. پیش‌تر این فناوری برای «راب بَرو»، بازیکن راگبی، موفقیت‌آمیز بود.

عکسی خانوادگی از سارا، که در باغچه‌ای، روی یک صندلی آفتاب‌گیر ایستاده نشسته است. او لبخند می‌زند و صفحه نمایش فناوری Eye Gase خود را روی پایش گذاشته است. او یک بلوز آستین کوتاه سفید، عینک آفتابی و یک دستبند به مچ دست خود دارد

منبع تصویر، Sarah Ezekiel

توضیح تصویر، سارا نخستین بار در سال ۲۰۰۵ با فناوری ردیابی نگاه آشنا شد و آن را تجربه کرد

در نهایت، سایمون با استفاده از ابزار «جداکننده صدا» متعلق به شرکت الون‌لبز توانست صدای سارا را از پس‌زمینه بلند تلویزیون جدا کند، اما نتیجه ضعیف و بی‌روح بود؛ فاقد لحن و شخصیت واقعی و با لهجه‌ای آمریکایی.

در نتیجه او به سراغ اپلیکیشن دیگری رفت؛ در این اپلیکیشن هوش مصنوعی با استفاده از هزاران نمونه صدا آموزش دیده بود تا خلأهای باقی‌مانده از ابزار جداکننده صدا را پر کند و پیش‌بینی کند صدایی مثل صدای سارا چگونه می‌تواند با لحن طبیعی ادامه پیدا کند.»

در نهایت، سایمون توانست چند عبارت صوتی بسازد که از کیفیت‌شان راضی بود و آن‌ها را برای سارا فرستاد.

سایمون می‌گوید سارا به او گفته بود که وقتی برای اولین بار صد��ی تازه‌اش را شنید، نزدیک بود گریه کند. حتی یکی از دوستان قدیمی‌اش که صدای او را به یاد داشت، «از واقعی و طبیعی بودن صدا شگفت‌زده شد.»

اما آویوا و اریک وقتی صدای او را شنیدند چه واکنشی نشان دادند؟

تصویری نزدیک از صفحه نمایش کامپیوتر با یک کیبورد دیجیتالی روی آن، که سارا از آن برای ساخت کلمات با استفاده از فناوری نگاه کردن به چشم استفاده می‌کند. روی صفحه نمایش نوشته شده است: «من دوباره احساس می‌کنم که خودم هستم و از Grid 3 از Smartbox با صدای Eleven Labs استفاده می‌کنم و صدایم شبیه نیست به به...»
توضیح تصویر، سارا ابتدا واژه‌هایی را که می‌خواهد بگوید می‌نویسد، سپس آن‌ها را با صدای بازسازی‌شده‌اش بیان می‌کند

آویوا توضیح می‌دهد: «تجربه‌ای شگفت‌انگیز بود. هنوز باور کردنش برایم دشوار است، و هر بار که در زندگی روزمره صدای او را می‌شنوم، باز هم غافلگیر می‌شوم.»

صدای تازهٔ سارا خانواده را به هم نزدیک‌تر کرده، چون حالا می‌تواند احساساتش را بیان کند و خوشحالی، غم یا عصبانیتش را نشان دهد. اریک می‌گوید: «این تغییر واقعاً تفاوت بزرگی ایجاد کرده است.»

آویوا می‌گوید: «حالا می‌توانیم شخصیت واقعی مادر را احساس کنیم. او دیگر فقط یک فرد ناتوان در گوشه‌ای با صدای رباتیک نیست.»

آیوا و اریک کنابر هم نشسته‌اند و لبخدند می‌زنند
توضیح تصویر، آویوا و اریک می‌گویند صدای تازه مادرشان باعث نزدیکی بیشتر اعضای خانواده شده است

به گفتهٔ دکتر سوزان اُمان، پژوهشگر داده، هوش مصنوعی و جامعه در دانشگاه شفیلد: «تولید صدا با کمک هوش مصنوعی جهشی چشمگیر نسبت به صدای مصنوعی قدیمی یا انتخاب صدا از میان آرشیوهای ازپیش‌ضبط‌شده است.»

او می‌گوید: «این موضوع مربوط به هویت شما و ارتباطتان با خود واقعی‌تان است. اگر آن [صدا] شبیه شما نباشد، حس نمی‌کنید که واقعاً خودتان هستید.»

اُمان تأکید می‌کند: «در دورانی که فناوری گرایش به یکنواخت‌کردن صدا و لهجه‌ها دارد، حفظ و نگهداری آن‌ها اهمیتی دوچندان پیدا می‌کند.»

او توضیح می‌دهد: «لهجه، هویت طبقاتی و خاستگاه‌تان افراد را آشکار می‌کند. مردم در گوشه و کنار جهان می‌کوشند لهجه‌ها و گویش‌های فراموش‌شده را دوباره زنده کنند.»

او با خنده می‌گوید: «گاهی حتی دلم برای صدای مصنوعی قدیمی‌ام تنگ می‌شود. آن صدا آن‌قدر شیک بود که کسی نمی‌فهمید لهجه من در اصل کاکنی (لهجه‌ای محلی از شرق لندن) است و کمی لکنت دارم.»

سارا می‌گوید از دستیابی دوباره به صدای قدیمی‌اش خوشحال است: «خوشحالم که دوباره خودم شده‌ام. این خیلی بهتر از ربات‌بودن است.»