تلاش ۳۰ گروه برای ممنوعیت نظارت بر اطلاعات شهروندان اروپا

 
 
۳۰ گروه حمایت از حقوق شهروندی و دیجیتال قصد دارند با جمع آوری یک میلیون امضا درباره ممنوعیت نظارت بر اطلاعات بیومتریک به اتحادیه اروپا فشار وارد کنند.
 
 به نقل از رویترز، گروه‌های حمایت از حقوق شهروندی و دیجیتال افراد در اروپا با ارائه دادخواستی، خواهان پشتیبانی حداقل یک میلیون شهروند اروپایی هستند تا درباره ممنوعیت نظارت گسترده بر اطلاعات بیومتریک به اتحادیه اروپا فشار وارد کنند.
 
این درحالی است که اتحادیه اروپا قصد دارد در سال جاری میلادی قوانینی در خصوص هوش مصنوعی تصویب کند.
 
ابزارهای نظارتی مانند سیستم‌های شناسایی چهره نگرانی‌هایی درباره حفظ حریم شخصی و حقوق بنیادین شهروندان به وجود آورده‌اند. سازمان‌های حمایت از حقوق شهروندی نیز بیم آن دارند که از چنین فناوری‌هایی برای نقض قوانین حقوق بشر استفاده شود.
 
اتحادیه اروپا تصمیم دارد در سه ماهه نخست سال جاری میلادی لایحه‌ای درباره هوش مصنوعی ارائه کند که بخش‌های پر ریسک مانند خدمات درمان، انرژی و حمل و نقل را در بر می‌گیرد.
 
اتحادیه آزادی‌های مدنی اروپا، سازمان حقوق دیجیتال اروپاییان و ۲۸ گروه دیگر درباره خطرات جمع آوری اطلاعات بیومتریک از طریق دوربین‌های مدار بسته و فناوری شناسایی صورت هشدار داده‌اند.
 
این سازمان‌ها تصمیم دارند با جمع یک میلیون امضا به طور مستقیم در فرایند قانونگذاری شرکت کنند. آنها ادعا می‌کنند هم اکنون شواهدی از سوءاستفاده گسترده و سیستماتیک از اطلاعات بیومتریک شهروندان سراسر اروپا جمع آوری کرده‌اند.
 
سال گذشته آژانس حقوق بنیادین اروپا که بر حقوق شهروندان این اتحادیه نظارت می‌کند، درباره ریسک‌های استفاده از هوش مصنوعی در سیاست‌های پیشگیرانه، تشخیص پزشکی و تبلیغات هدفمند هشدار داد.

تولید حافظه پهن باند با پردازشگر هوش مصنوعی

 
تراشه حافظه جدیدی را تولید شده که پهنای باند وسیعی دارد و دارای یک پردازشگر مبتنی بر هوش مصنوعی برای ارتقای کیفیت است.
 
 به نقل از زد دی نت، سامسونگ مدعی است که استفاده از فناوری هوش مصنوعی در این پردازنده حافظه موجب دو برابر شدن کیفیت و عملکرد آن می‌شود.
 
این شرکت اولین بار در سال ۲۰۱۸ یک موتور هوش مصنوعی را در تراشه‌ای به نام HBM۲ Aquabolt به کار گرفت و حالا موتور یادشده را به روز کرده و از آن در تراشه حافظه جدید خود استفاده کرده است.
 
این تراشه که HBM-PIM نام دارد به مدد بهره مندی از هوش مصنوعی تا ۷۰ درصد کمتر از تراشه‌هایی مانند HBM۲ برق مصرف می‌کند. سامسونگ می‌گوید در آینده می‌توان موتورهای هوش مصنوعی را در درون حافظه‌های مختلف جای داد و از این طریق بر ظرفیت پردازش آنها افزود.
 
این شرکت تراشه‌های یادشده را برای استفاده در مراکز داده، سیستم‌های رایانه‌ای پیشرفته و در گوشی‌های هوشمند مناسب می‌داند و از همکاری با آی بی ام برای تولید مشترک چنین تراشه‌هایی خبر داده است. تولید انبوه این تراشه‌ها ظرف شش ماه آینده آغاز می‌شود.

«آواتار» به کمک پاسخگویی به مشترکان ایرانسل می‌آید

 
فاز اول «آواتار (Avatar)»، پلتفرم پاسخگویی هوشمند به مشترکان ایرانسل با استفاده از هوش مصنوعی، توسط وزیر ارتباطات و فناوری‌اطلاعات رونمایی شد.
 
به گزارش روابط عمومی ایرانسل، با بهره‌برداری از «آواتار»، هوش مصنوعی (AI) به کمک پاسخگویی به مشترکان در مرکز ارتباط با مشتریان ایرانسل می‌آید.
 
بر این اساس، آواتار می‌تواند به عنوان پاسخگوی مشترک، ارائه خدمات بر بستر VOIP را فراهم کند. این ویژگی، مرکز ارتباط با مشتریان را به صورت مجازی گسترش داده و امکان مدیریت تماس‌های ورودی بیشتری را با همزمانی بالا فراهم می‌کند. آواتار همچنین علاوه بر ارتقای کیفیت خدمات و کاهش هزینه‌ها، سطح رضایت مشتریان را افزایش می‌دهد.
 
آواتار، صبح امروز سه‌شنبه ۲۸ بهمن ماه ۱۳۹۹، با حضور مهندس محمدجواد آذری‌جهرمی وزیر ارتباطات و فناوری‌اطلاعات و دکتر بیژن عباسی‌آرند مدیرعامل ایرانسل، در غرفۀ ایرانسل در نمایشگاه اینترنت اشیا (IoTEX)، واقع در سالن 27 محل دائمی نمایشگاه‌های بین‌المللی تهران، رونمایی شد.
 
ایرانسل همواره کوشیده است تا با پیاده‌سازی روش‌های نوین و دیجیتال، امکان دسترسی مشترکان به کارشناسان ایرانسل و پاسخگویی سریع و دقیق به مشترکان را هر چه بیشتر تسهیل کند. مشترکان ایرانسل می‌توانند به صورت شبانه‌روزی، در هفت روز هفته، از طریق گفت‌وگوی آنلاین در وب‌سایت ایرانسل و اپلیکیشن ایرانسل من، ارسال پیام در حساب‌های ویژۀ پاسخگویی به مشتریان ایرانسل در شبکه‌های اجتماعی با نام‌های کاربری irancellhelp و irancellsupport و در اپلیکیشن‌های پیام‌رسان با نام کاربری irancellCRMbot و نیز تماس تلفنی با شماره‌گیری شماره ۷۰۰ از خطوط ایرانسلی و ۰۹۳۷۷۰۰۰۰۰۰ از سایر خطوط، پرسش‌ها یا مشکلات احتمالی خود را با کارشناسان مرکز ارتباط با مشترکان ایرانسل، مطرح و پاسخ لازم را دریافت کنند.
 
ایرانسل، اپراتور پیشرو در کسب رضایت مشتری، آذر ماه امسال، برای هفتمین سال متوالی، موفق شد تندیس طلایی رعایت حقوق مصرف‌کنندگان را از معاون وزیر صنعت، معدن و تجارت و رئیس سازمان حمایت مصرف‌کنندگان و تولیدکنندگان و نیز لوح زرین دهمین دورۀ «همایش سراسری رضایتمندی مشتری با رویکرد جهش تولید» را به‌عنوان تنها اپراتور تلفن‌همراه دریافت‌کنندۀ این لوح کسب کند.

برگزاری رویداد فناورانه «کمپ رقابتی هوش مصنوعی» با مشارکت همراه اول

تیم‌های خلاق با حمایت همراه‌اول می‌توانند ایده‌های هوش مصنوعی خود را در یک رویداد 10 هفته‌ای به ساخت نمونه اولیه تبدیل کنند.
 
 
به گزارش اداره‌کل ارتباطات شرکت ارتباطات سیار ایران، رویداد فناورانه «کمپ رقابتی هوش مصنوعی» با مشارکت همراه اول، هاب شهید بهشتی و پارک علم‌وفناوری دانشگاه شهید بهشتی با هدف حمایت از تیم‌های خلاق در این حوزه برگزار می‌شود و تیم‌های برتر امکان تبدیل ایده خود به پروتوتایپ را خواهند داشت.
تیم‌ها و افراد متخصص در زمینه کسب‌وکار هوش مصنوعی پس از ثبت‌نام در سایت استارهاب، وارد مرحله غربالگری می‌شوند و پس از آن طی یک فرآیند 10 هفته‌ای در کمپ رقابتی حضور پیدا می‌کنند تا ضمن استفاده از آموزش‌های تخصصی و منتورینگ حرفه‌ای، ایده خود را به پروتوتایپ قابل ارائه تبدیل کنند.
در پایان کمپ، تیم‌ها از طریق یک فرایند بازی‌وار شده که شرایط بازار واقعی را شبیه‌سازی می‌کند، پروتوتایپ خود را ارائه می‌دهند. 5 تیم برتر این فرصت را خواهند داشت که علاوه بر کسب رتبه و جایزه، در صورت اخذ امتیازات لازم تا  4 میلیارد تومان خدمات و سرمایه دریافت کنند و وارد روند حمایت‌های تکمیلی شوند. همچنین جوایزی برای تیم‌های اول تا سوم در نظر گرفته شده که به ترتیب ۲۰ میلیون تومان، ۱۳ میلیون تومان و ۱۰ میلیون تومان خواهد بود.
در این ماراتن 10 هفته‌ای، تیم‌ها از خدماتی چون «منتورینگ توسط مجموعه‌های خبره AI»، «سرویس‌های زیرساختی از جمله سرور، هاستینگ و دامین»، «50 ساعت آموزش عمومی کسب‌وکار و ۵۰ ساعت آموزش تخصصی حوزه‌ هوش مصنوعی» و «فضای فیزیکی در صورت درخواست تیم» به‌صورت رایگان برخوردار خواهند شد.
علاقه‌مندان می‌توانند جهت کسب اطلاعات بیشتر و ثبت‌نام به سایت استارهاب به نشانی http://starhub.info مراجعه کنند.
 

وزیر ارتباطات و فناوری اطلاعات از غرفه پژوهشگاه ارتباطات و فناوری اطلاعات بازدید کرد

 
وزیر ارتباطات و فناوری اطلاعات صبح امروز از غرفه پژوهشگاه ارتباطات و فناوری اطلاعات در نمایشگاه سالیانه هفته ایران دیجیتال بازدید کردند.
به گزارش روابط عمومی پژوهشگاه ارتباطات و فناوری اطلاعات، صبح امروز سه شنبه ۲۸ بهمن، آذری جهرمی از غرفه پژوهشگاه ارتباطات و فناوری اطلاعات در رویداد سالیانه هفته ایران دیجیتال بازدید کرد و از نزدیک در جریان پیشرفت طرح های ارائه شده از سوی پژوهشگاه ICT با عناوین، اینترنت اشیاء (IoT)، نسل پنجم تلفن همراه (۵G) و ابر رایانه سیمرغ قرار گرفت.
 
بنابراین گزارش این رویداد با شعار ارتباطات هوشمندانه (Intelligent Connectivity) در قالب سمینارها و نشست‌های تخصصی بصورت مجازی و حضوری با محوریت سه موضوع نسل پنجم تلفن همراه (۵G)، اینترنت اشیاء (IoT) و هوش مصنوعی (AI)در روزهای ۲۷ و ۲۸ بهمن ماه در نمایشگاه بین المللی تهران برگزار می‌­شود.

گاه‌شمار هوش مصنوعی در ایرانداک آغاز به کار کرد

در پاسخ به نیاز روزافزون پژوهشگران و دانشوران برای آگاهی از زمینه‌های نوین فناوری اطلاعات، پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، گاه‌شمار برخطِ هوش مصنوعی را در نشانی AI.IRANDOC.AC.IR، راه‌اندازی کرده است.
 
به گزارش «روابط عمومی پژوهشگاه علوم و فناوری اطلاعات ایران»،  این سامانة دو زبانه، روند تاریخی هوش مصنوعی و دگرگونی‌های آن را نشان می‌دهد. هوش مصنوعی یکی از زمینه‌های نوپدید علم است که در زمانی کوتاه پس از برآمدن، نقش و تأثیری کلیدی در دیگر زمینه‌های علمی داشته است. کاربرد هوش مصنوعی چیزهایی را پدید خواهد آورد که دارای اندیشه یا کارکرد منطقی هستند یا مانند انسان می‌اندیشند و یا کار می‌کنند.
 
بررسی رویدادهای تاریخی هوش مصنوعی، می‌تواند به درک بهتر چگونگی پیدایش این زمینه، رویدادهای کلیدی توسعة آن، پیوند آن با دیگر رشته‌های علمی، و نام‌های کلیدی و تاثیرگذار بینجامد. یکی از ابزارهای کلیدی برای دریافت چنین دیدگاهی، نمایش دیداری داده­ها و تفسیر و تحلیل­های دیدنی است. یکی از ساده‌ترین ساختارها برای نمایش داده‌های تاریخی، ساختار دو بُعدیِ رویداد ـ زمان است. یک رویداد اطلاعات دیگری را هم دارد که با همراه کردن آن‌ها، ماهیتی چند بُعدی پیدا می‌کند که ساختار سادة رویداد ـ زمان باید به گونه‌ای دیگر و با نمودارهای پیچیده‌تر پیاده شود تا بتوان الگوهای گوناگون در میان رویدادها دریافت. یکی از راهکارهای پاسخ به این نیاز، کاربست نمودارهای واکنشی است که در آن‌ها، کاربر می‌تواند به سویه‌های گوناگونی از داده‌ها بپردازد و از نگاه‌های گوناگون و بر پایة نیاز، هدف، و برداشت خود؛ تنها با چند کلیک آن‌ها را بررسی کند.
 
گفتنی است گاه‌شمار برخطِ هوش مصنوعی رویدادهای تاریخی و کلیدی را در زمینة هوش مصنوعی بازنمایی می‌کند. این دیداری‌سازی به نمایش واکنشی رویدادها در زمان، نمایش شبکة دانشمندان و همکاری میان آن‌ها، و نمایش جغرافیایی زیرزمینه‌های هوش مصنوعی در زمان می‌پردازد.
 

هوش مصنوعی چگونه صدای تلویزیون‌ها را متحول کرد

 
ورود هوش مصنوعی به تلویزیون‌ها مزایای بسیاری را با خود به دنیای سرگرمی آورده است، از پردازش سریع‌تر و باکیفیت‌تر تصاویر تا پیشنهادهای هوشمندانه محتواها و قابلیت ارتقا تصویر (Upscaling) همگی موجب شده تا تجربه تماشای تلویزیون‌ برای بیننده‌ها متحول شود و آنها راحت‌تر و چشم‌نوازتر محتوای مورد علاقه خود را پیدا و مشاهده کنند. پیش‌بینی می‌شود که این رویه طی سال‌های آینده پیشرفت‌های خارق‌العاده‌ای را در دنیای سرگرمی به وجود بیاورد و امکانات بی‌نظیری را در اختیار بیننده‌ها بگذارد.  
یکی از عرصه‌هایی که با ورود هوش مصنوعی به تلویزیون‌ها متحول شده صدای تلویزیون‌هاست. کیفیت صدای پخش شده از تلویزیون‌ها به همان میزان کیفیت تصاویر مهم و حیاتی‌ست و یک صدای فراگیر و گسترده می‌تواند هیجان و لذت تماشای فیلم‌ها و مسابقات ورزشی را چند برابر کند. 
 
برای مثال در سری‌های 2020 تلویزیون‌های QLED سامسونگ از قابلیتی به نام ردیابی صوتی اشیا یا OTS (Object Tracking Sound) استفاده می‌شود. در این قابلیت صدای سوژه‌ها هماهنگ با حرکات آنها پخش می‌شود تا بیننده‌ها سطح جدیدی از صدای پویا، سه‌بعدی و فراگیری را بشنوند. در فناوری OTS به کمک نرم‌افزارهای هوش مصنوعی، حرکات سوژه‌ها تشخیص داده می‌شود و از طریق بلندگوهای تلویزیون و بدون نیاز به دستگاه‌های جانبی صداهای مربوط به سوژه‌ها از قسمت‌های مختلف بلندگوهای تلویزیون پخش می‌شود. ترکیب این فناوری با هوش مصنوعی کمک کرده تا در تلویزیون‌های QLED سامسونگ لذت شنیدن یک صدای فراگیر و غرق شدن در هیجان فیلم‌ها و ویدئوها بیشتر از قبل شود.  
 
در قابلیتی دیگر در تلویزیون‌های 2020 QLED سامسونگ هوش مصنوعی تلویزیون با تشخیص نوع برنامه پخش شده (شامل فیلم سینمایی یا مسابقه ورزشی یا اخبار تلویزیون و...) و همین طور میزان صدای محیط اطراف و اتاق‌ها، بهینه‌ترین صدا را از نظر شدت و کیفیت برای تماشاگران ارسال می‌کند. در این قابلیت که با نام Adaptive Sound+ شناخته می‌شود تطبیق صداها به شکلی هوشمندانه و سریع انجام می‌شود.
با این قابلیت‌ها دیگر مهم نیست که در کدام قسمت از اتاق یا سالن خانه نشسته‌اید، بلندگوهای هوشمند و فراگیر تلویزیون‌های سری 020 QLED با تحلیل و بررسی فضای اطراف خود بهترین و باکیفیت‌ترین صدای ممکن را به گوش شما می‌رسانند. 
 
همچنین برای زمان‌هایی که صدای محیط زیادتر از حد معمول می‌شود مثل مواقعی که جارو برقی خانه روشن می‌شود و به کار می‌افتد قابلیت Active Voice Amplifier طراحی شده است. در این قابلیت صدای تلویزیون همزمان با افزایش صدای محیط زیاد می‌شود تا نیازی به بلندتر کردن صدا از طریق کنترل تلویزیون نباشد. 
 
مدل‌های جدید QLED سامسونگ اوایل سال 2020 رونمایی و پس از آن روانه بازارهای جهانی شدند. در این تلویزیون‌ها برای نخستین بار از طراحی بدون مرز یا Infinity Screen بهره گرفته شده تا صفحه نمایشی با کمترین حاشیه را شاهد باشیم.  
 
تلویزیون‌های 2020 QLED همچنین از نخستین سری‌هایی هستند که از قابلیت جدید و نوآورانه ساندبارهای سامسونگ به نام  Q-Symphony پشتیبانی می‌کنند. به کمک این قابلیت‌ تلویزیون‌های 2020 QLED می‌توانند به طور همزمان با ساندبار صداها را پخش کنند. تا پیش از این، صدای تلویزیون‌های سامسونگ به محض روشن شدن و اتصال به ساندبار قطع می‌شد تا صداها با یکدیگر تداخل نداشته باشد و صداها تنها از طریق بلندگوهای ساندبار پخش شود. اما سری‌های 2020 تلویزیون‌های QLED به بلندگوهایی مجهز شده‌اند که امکان استفاده همزمان از بلندگوهای تلویزیون و ساندبار را فراهم می‌کند. Q-Symphony به دلیل توانایی در تولید صدای فراگیر و غنی توانست جایزه بهترین نوآوری را در CES 2020 کسب کند. 
وجود فناوری‌ها و قابلیت‌های نوآورانه‌ای مثل OTS، Adaptive Sound+ و Q-Symphony موجب شده تا مدل‌های 2020 تلویزیون‌های QLED سامسونگ تجربه‌ صوتی کاربران را به اوج هیجان و لذت برسانند.  
 

دیپ‌فیک صوتی چیست و آیا تهدیدی برای جوامع بشری به حساب می‌آید؟

دیپ‌فیک ویدیویی بدین معنا است که ما نمی‌توانیم به هر آنچه که می‌بینیم، اعتماد کنیم. حال دیپ‌فیک صوتی نیز بدین معنا است که دیگر گوش‌های ما قابل اعتماد نیستند. چنین فناوری‌هایی باعث می‌شوند تا مشکلات بشر روزبه‌روز افزایش یابند. در قرن بیستم تنها نگرانی تکنولوژیک انسان‌ها، به مسائلی همانند بمب‌های اتمی و شیمیایی مربوط می‌شد، اما اکنون این دامنه گسترش یافته است.

در چند سال گذشته نگرانی‌های مختلفی در مورد ماشین‌ها و بیماری‌های همه‌گیر به وجود آمده و حال نیز نوبت به دیپ‌فیک صوتی رسیده است؛ چیزی که باعث می‌شود تا مردم اعتماد به صدای یکدیگر را نیز از دست بدهند.

دیپ‌فیک صوتی چیست؟

به احتمال زیاد، ویدیوهای دیپ‌فیک را مشاهده کرده‌اید. در این ویدیوها از الگوریتم‌های یادگیری عمیق استفاده شده و بدین ترتیب رفتارهای دو نفر با یکدیگر جایگزین می‌شوند. در صدای دیپ‌فیک یک صوت شبیه‌سازی شده غیرقابل تشخیص استفاده شده تا بدین ترتیب بتوان صدای مصنوعی فرد موردنظر را تولید کرد؛ دقیقا همانند فتوشاپ کردن صدا.

حداقل فتوشاپ‌های غیرحرفه‌ای را می‌توان تشخیص داد، اما در مورد دیپ‌فیک صوتی فقط می‌توان حدس زد، آن هم با میزان درستی 57 درصد! علاوه بر این، از آنجایی که بسیاری از ضبط‌های صدا توسط میکروفن گوشی‌ها انجام می‌پذیرد (یا در محیط‌های پر سروصدا)، پس دیپ‌فیک صوتی می‌توانند بهتر کار خود را انجام دهد. حال سؤال اینجا است که چرا یک شخص باید به فتوشاپ کردن صدا بپردازد؟

توجیه تولید صدای مصنوعی

یکی از این موارد به صنعت بازی‌های ویدیویی مربوط می‌شود. در گذشته امکان نداشت که صدا را به محض درخواست، ایجاد کرد. حتی در عناوین تعاملی که از گرافیک سینمایی نیز برخوردار هستند، ارتباطات کلامی با شخصیت‌های غیرقابل بازی، چندان پویا به نظر نمی‌رسند.

حال با پیشرفت فناوری، استودیوهای بازی‌سازی نیز می‌توانند صدای شخصیت‌ها را شبیه‌سازی کرده و با استفاده از یک موتور تبدیل کننده متن به صوت، سخنان شخصیت‌های درون بازی‌ها را پویاتر نشان دهند. در واقع این فرایند در زمان واقعی رخ داده و از پیش تعیین و رندر نمی‌شود.

البته این فناوری استفاده‌هایی نیز در تبلیغات، فناوری و خدمات پشتیبانی از مشتریان دارد. در اینجا نیز صدای یک انسان قابل اعتماد شبیه‌سازی شده و متون گفتار نیز توسط هوش مصنوعی تعیین و ادا می‌شوند. شرکت‌های شبیه‌سازی صدا، در مورد کاربردهای پزشکی این فناوری نیز هیجان‌زده هستند. البته این موضوع چندان جدید نبوده و در واقع استیون هاوکینگ نیز از صدای مصنوعی استفاده می‌کرد. اما حال چنین مواردی می‌توانند بهبود بیشتری را تجربه کنند.

‌در سال 2008، شرکت شبیه‌سازی صدای CereProc، صدای راجر ایبرت (Roger Ebert) را پس از سرطان گرفتن وی، شبیه‌سازی کرد. همچنین این شرکت وب‌سایتی را نیز ایجاد کرده بود که در آن مردم می‌توانستند متنی را تایپ کرده و سپس این متن با صدای جورج بوش، بیان شود.

دیپ‌فیک صوتی

صدای شبیه‌سازی شده چگونه کار می‌کند؟

شبیه‌سازی صدا در حال حاضر از محبوبیت مناسبی برخوردار است. شرکت‌هایی همانند  Resemble AI و Descript وب‌سایت‌هایی را دایر کرده‌اند که می‌توانید در آن‌ها به‌صورت رایگان، صدای خود را شبیه‌سازی کنید. در این زمینه هوش مصنوعی و مخصوصا الگوریتم‌های یادگیری عمیق هستند که می‌توانند صدای ضبط شده را با متن مربوطه تطبیق داده و در نتیجه صدای شما را شبیه‌سازی کنند. در ادامه هوش مصنوعی از بلوک‌های ساختاری زبان استفاده کرده تا بدین ترتیب بتواند تقریبی از کلماتی را که تا به حال از زبان شما نشنیده، به دست آورد.

متیو آیلت (Matthew Aylett)؛ مدیر ارشد علمی شرکت CereProc می‌گوید: “پایه این فناوری مدت‌ها است که وجود دارد، اما تنها به مقداری کمک نیاز دارد. کپی کردن صدا همانند درست کردت شیرینی است. این کار کمی سخت بوده و همچنین راه‌های مختلفی نیز جهت انجام آن وجود دارند.”

توسعه‌دهندگان جهت کسب نتایج مورد قبول، به مقادیر زیادی از صداهای ضبط شده نیاز دارند. چند سال پیش، دانشمندان شبکه‌های GAN را توسعه ‌دادند. بدین ترتیب برای اولین بار، امکان قیاس از داده‌های موجود فراهم شد. آیلت می‌گوید: “به جای اینکه یک رایانه، تصویری را از یک اسب مشاهده کند و بگوید که این اسب است، مدل من اکنون می‌تواند یک اسب را به یک گورخر تبدیل کند. بنابراین پیشرفت‌های شبیه‌سازی صدا، مدیون تلاش‌های آکادمیک حوزه رایانه هستند.”

یکی از مهم‌ترین پیشرفت‌ها در زمینه شبیه‌سازی صدا، مربوط به کاهش حجم صدای اولیه موردنیاز است. در گذشته حجم بالایی از صدای شخص موردنیاز بود، اما اکنون تنها چند دقیقه کافی است.

ترس ناشی از بی‌اعتمادی به همه‌چیز

فناوری‌هایی همانند انرژی هسته‌ای، فناوری نانو، چاپ سه‌بعدی و CRISPR، در عین هیجان‌انگیز بودن، ترسناک نیز هستند. در اخبار نیز مواردی به چشم می‌خورند که طی آن‌ها، دیپ‌فیک صوتی توانسته که مردم را فریب دهد.

در کانال‌های یوتیوبی، می‌توان ویدیوهایی از رؤسای جمهور پیشین آمریکا را مشاهده کرد که در آن‌ها، این اشخاص مشغول خواندن یک آهنگ هستند. موسیقی و صداهای پس‌زمینه باعث می‌شوند تا حرکات رباتیک کمتر به چشم آیند، اما در هر صورت پتانسیل زیادی در این موضوع وجود دارد.

می‌توان به‌آسانی تصور کرد که این فناوری به مرور زمان بهتر خواهد شد. سیستم‌های صدای دیپ‌فیک به ورودی‌های کمتری احتیاج خواهند داشت و همچنین پردازش‌های سریع‌تر نیز می‌توانند شبیه‌سازی را در آن واحد انجام دهند. به مرور هوش مصنوعی بهتر نیز می‌تواند لحن و ریتم صدای اشخاص را بهتر شبیه‌سازی کند.

مسائل اخلاقی مرتبط با دیپ‌فیک صوتی

اکثر شرکت‌های فعال در این زمینه سعی دارند تا این فناوری را به جهت ایمن و درستی راهنمایی کنند. مثلا شرکت Resemble AI، یک بیانیه اخلاقی را در وب‌سایت خود قرار داده که در زیر به گزیده‌ای از آن اشاره می‌کنیم:

“ما نسبت به شرکت‌های مختلف، سختگیری‌هایی را اعمال کرده و مطمئن می‌شویم که صدای شبیه‌سازی شده توسط آن‌ها استفاده شده و همچنین رضایت کامل صدا پیشه‌ها را نیز جلب کرده‌اند.”

کاندان کومار (Kundan Kumar)؛ بنیان‌گذار Lyrebird (که اکنون بخشی از Descript است)، می‌گوید که Lyrebird از ابتدا نسبت به سوءاستفاده حساس بوده و به همین دلیل است که اکنون Descript به مردم اجازه می‌دهد که فقط صدای خود را شبیه‌سازی کنند.

خوب است که می‌شنویم بازیگران مطرح این صنعت، به موازین اخلاقی پایبند هستند. اما در هر صورت ابزارهای دیپ‌فیک صوتی دیگری نیز وجود دارند که چنین رویه‌ای را در پیش نگرفته و حتی جهت سوءاستفاده از آن‌ها، به دانش کدنویسی نیز نیازی ندارید.

متخصصان امنیت، پیش‌تر نیز با چنین مواردی مواجه شده‌اند

پیش‌ از اینکه دیپ‌فیک صوتی قابل استفاده باشد، کلاهبرداران همیشه سعی کرده‌اند که به‌صورت تلفنی، نسبت به سرقت پول اقدام کنند، اما متخصصان امنیت در این‌گونه مواقع نیز حاضر بوده‌اند. شرکت‌هایی همانند Pindrop به این کار مشغول بوده و طبق ادعاهای این شرکت، آن‌ها 1.2 میلیارد مکالمه صوتی را تحلیل کرده و توانسته‌اند که از سرقت 470 میلیون دلار پول، جلوگیری کنند.

پیش از دیپ‌فیک صوتی، کلاهبرداران از مکانی دیگر تماس می‌گرفتند و با ارائه اطلاعات شخصی هدف خود، سعی می‌کردند که وجوه وی را انتقال دهند. ویجی بالاسوبرامانیان (Vijay Balasubramaniyan)؛ مدیرعامل Pindrop، می‌گوید: امضای صوتی به ما اجازه می‌دهد که ویژگی‌های صوتی را تشخیص داده و بدین ترتیب بفهمیم که تماس موردنظر از نیجریه و با استفاده از اسکایپ صورت گرفته است. در حالی که می‌دانیم مشتری واقعی از گوشی AT&T استفاده کرده و از آتلانتا نیز تماس می‌گیرد. گاهی اوقات با کلاهبردارهایی مواجه می‌شویم که صدای جوجه و یا گریه کودک را در پس‌زمینه تماس‌های خود استفاده می‌کنند تا بدین ترتیب بتوانند کارمندان ما را فریب دهند. حتی مواردی نیز داشته‌ایم که در آن‌ها مردها سعی کرده‌اند تا با استفاده از ابزارهای شبیه‌سازی، فرکانس صدای خود را افزایش داده و بدین ترتیب صدای خود را زنانه جلوه دهند. اما گاهی اوقات نرم‌افزار مورد استفاده آن‌ها خوب کار نکرده و صدایی شبیه به شخصیت‌های کارتونی تولید می‌کند.”

آیا کسی می‌تواند دیپ‌فیک صوتی را تشخیص دهد؟

اگر پس از گوش دادن به صدای یک شخص، به سختی بتوانیم مصنوعی بودن آن را متوجه شویم، آنگاه این موضوع می‌تواند حاوی خبرهای خوب و بدی برای ما باشد. خبر خوب این است که هوش مصنوعی و سیستم‌های یادگیری عمیق در حال تکامل بوده و جهت تولید صدایی واقعی، به ورودی‌های کمتری احتیاج دارند. خبر بد هم این است که تشخیص موارد تقلبی و همچنین کلاهبرداری‌ها نیز مشکل‌تر می‌شود.

هر چقدر طول یک فایل کمتر باشد و در محیط‌های شلوغ‌تری نیز ضبط شده باشد، آنگاه تشخیص دیپ‌فیک بودن آن نیز سخت‌تر خواهد شد. نکته‌ای که در این بین وجود دارد، این است که اگر انسان‌ها قادر به تشخیص صدای تقلبی نباشند، در هر صورت کامپیوترها قادر به انجام این کار خواهند بود. خوشبختانه ابزارهای تصدیق هم‌اکنون نیز وجود دارند. شرکت Pindrop ابزاری را استفاده می‌کند که حتی اگر تمامی صداهای فایل مورد بررسی نیز توسط شخص واقعی ضبط شده باشند، بازهم بتواند مصنوعی بودن صدای شبیه‌سازی شده را تشخیص دهد.

بسته به کیفیت صدا، هر ثانیه از مکالمه می‌تواند بین 8000 الی 50000 نمونه داده جهت تحلیل را در بر داشته باشد. بالاسوبرامانیان می‌گوید: “چیزی که ما به دنبال آن هستیم، محدودیت‌های گفتاری ناشی از تکامل انسان‌ها هستند. به‌عنوان مثال، دو صدای آواز، حداقل تفاوت‌هایی را با یکدیگر دارند، زیرا به دلیل محدودیت‌های فیزیکی، نمی‌توان برخی از عبارات را از حدی سریع‌تر بیان کرد. مثلا با شنیدن برخی از صداهای ترکیبی، می‌گوییم که امکان ندارد این صدا متعلق به یک انسان باشد، زیرا برای ادای آن، فرد باید یک گردن 7 فوتی داشته باشد.”

برخی صداها نیز وجود دارند که سایشی نامیده می‌شود (حروفی همانند F ،S ،V و Z). سیستم‌های یادگیری عمیق به‌سختی می‌توانند این صداها را از نویزها تمایز دهند. الگوریتم‌های هوش مصنوعی به‌سختی می‌توانند پایان کلمات را از نویز پس‌زمینه تمایز دهند، بنابراین محو شدن کلمات در چنین مدل‌هایی، بیش از گفتار واقعی انسان‌ها رخ می‌دهد. به همین دلیل رایانه‌ها آسان‌تر می‌توانند مصنوعی بودن صدا را تشخیص دهند.

مقابله با دیپ‌‎فیک، هوشیاری می‌طلبد

پیش‌بینی دقیق آینده دیپ‌فیک صوتی، دشوار است. اما می‌توان گفت که ما در آستانه کلاهبرداری‌های صوتی قرار داریم، هر چند که خطر وقوع چنین مواردی در حال حاضر پایین بوده و ابزارهای تشخیصی نیز می‌توانند کار خود را به‌خوبی انجام دهند.

هنری آجِر (Henry Ajder)؛ مدیر بخش تهدید اطلاعاتی در Deeptrace، می‌گوید: “اگر مردم ابزارهای دیپ‌فیک صوتی متن-باز را به یکدیگر متصل کرده و سپس آن‌ها را در قالب اپلیکیشن و یا سرویس‌های کاربرپسند (و بدون تعهدات اخلاقی) عرضه کنند، آنگاه مشکلات متعددی در این زمینه به وجود خواهند آمد.”

بدین ترتیب، حیاتی است که شرکت‌های امنیتی خود را در برابر چنین تهدیدهایی مقاوم کرده و به‌عنوان مثال بتوانند آسیب‌پذیری روز-صفر بعدی را بهتر درک کنند که طبیعتا دیپ‌فیک صوتی کاندیدای اصلی این موضوع خواهد بود.

نوشته دیپ‌فیک صوتی چیست و آیا تهدیدی برای جوامع بشری به حساب می‌آید؟ اولین بار در اخبار فناوری و موبایل پدیدار شد.

سرمایه گذاری یک میلیارد دلاری مایکروسافت در توسعه هوش مصنوعی

مایکروسافت یک میلیارد دلار در شرکتی سرمایه گذاری کرده تا سیستم هوش مصنوعی عمومی را توسعه دهد. چنین سیستمی قادر به انجام فعالیت های مختلف است.
 
سرمایه گذاری يك میلیارد دلاري مایکروسافت در توسعه هوش مصنوعی
به گزارش خبرگزاری مهر به نقل از تلگراف، مایکروسافت قصد دارد یک میلیارد دلار در شرکت هوش مصنوعی سرمایه گذاری کند که الون ماسک آن را تاسیس کرده است.
 
این شرکت که Open AI نام دارد، قرار است با استفاده از سرویس ابر مایکروسافت به نام Azure نرم افزار هوش مصنوعی را آموزش می دهد. این شرکت ها قصد دارند به طور مشترک فناوری ابررایانش را توسعه دهند.
 
کارشناسان معتقدند مایکروسافت احتمالاً در تجاری سازی محصول Open AI شریک خواهد بود. در حقیقت این شرکت قصد دارد نوعی هوش مصنوعی عمومی توسعه دهد. چنین سیستمی شبیه مغز انسان است و می تواند فعالیت های مختلفی انجام دهد.
 
این در حالی است که هم اکنون سیستم های هوش مصنوعی فقط می توانند یک فعالیت را انجام دهند. بنابراین توسعه هوش مصنوعی عمومی قابلیت های خارق العاده ای خواهد داشت اما بسیاری کارشناسان معتقدند توسعه چنین سیستمی ممکن است چند دهه طول بکشد.
 
الون ماسک در سال ۲۰۱۵ میلادی با همکاری سام آلتمن (یکی از سرمایه گذاران سیلیکون ولی) این شرکت را تاسیس کرد. البته اکنون ماسک از این شرکت کناره گرفته و آلتمن آن را رهبری می کند. این شرکت تاکنون موفقیت هایی به دست آورده است مانند توسعه هوش مصنوعی که توانست در بازه رایانه ای Dota۲ بر رقیب انسانی خود پیروز شود.

“نقشه گوگل” شلوغی اتوبوس و متروی را پیش‌بینی می‌کند

ویژگی جدید نقشه گوگل یا همان "گوگل مپز" می‌تواند شلوغ بودن احتمالی اتوبوس یا قطار مترویی که کاربر قصد سوار شدن در آن را دارد، پیش‌بینی کند. این امکان به‌زودی در ۲۰۰ شهر در دسترس قرار می‌گیرد.
 
به گزارش ایسنا و به نقل از انگجت، حمل و نقل عمومی برای عموم مردم حیاتی و بسیار کاربردی است، اما هیچ‌کس نمی‌خواهد در یک قطار مترو یا اتوبوس محصور شود و در شلوغی گیر کند.
 
google map 2.jpg
 
سرویس "نقشه گوگل" (Google Maps) به منظور کمک به شهروندان در دانستن میزان شلوغی وسیله نقلیه مورد استفاده برای رسیدن به مقصد، شلوغی را پیش‌بینی می‌کند و آن را به کاربران نشان خواهد داد.
 
گوگل با استفاده از داده‌های سفرهای قبلی اتوبوس‌ها و قطارهای مترو، خلوتی یا شلوغی اتوبوس یا قطار بعدی را پیش‌بینی می‌کند.
 
این ویژگی از امروز در ۱۸ شهر بریتانیا شامل بیرمنگام، برایتون، بریستول، کمبریج، کاردیف، کاونتری، کراولی، ادینبرو، گلاسکو، لیدز، لیورپول، لندن، نیوکاسل، ناتینگهام، آکسفورد، ردینگ، شفیلد و ساوتهمپتون در دسترس خواهد بود. گوگل قصد دارد پیش‌بینی‌های خود را برای تقریباً ۲۰۰ شهر در سراسر جهان بر روی سیستم عامل اندروید و iOS فراهم کند.
 
 
در عین حال "نقشه گوگل" اطلاعات تأخیر وسایل نقلیه عمومی را به طور زنده نمایش می‌دهد.
 
گوگل اعلام کرده است که این برنامه جزئیات بیشتری را درباره اینکه آیا اتوبوس شما تأخیر خواهد داشت یا نه و اینکه چقدر باید انتظار بکشید، ارائه می‌دهد و همچنین بر اساس شرایط ترافیک پیش‌بینی دقیق‌تری از مدت سفر خواهد داشت.
 
 
 
"نقشه گوگل" همچنین به کاربران نشان خواهد داد که اتوبوس یا قطاری که تأخیر کرده، هم‌اکنون کجاست، بنابراین کاربران تکلیف خود را می‌دانند.
 
کاربران با این ویژگی حداقل قادر خواهند بود حرف دقیق‌تری راجع به زمان رسیدنشان به دیگران بگویند و یا در صورت اطلاع از شلوغی بیش از حد، مسیر دیگری را انتخاب کنند.