خلبانی ʺلونʺ به هوش مصنوعی سپرده شد
به نقل از خبرگزاری ایسنا1399/9/13کد خبر 13999595324
فناوری هوش مصنوعی گوگل در حال هدایت بالنهای توزیع اینترنت موسوم به "لون"(Loon) است که با یادگیری تقویتی قادر است این بالنها را بسیار کارآمدتر هدایت کند.
به گزارش ایسنا و به نقل از انگجت، بالنهای توزیع اینترنت شرکت "الفبت"(Alphabet) شرکت مادر گوگل موسوم به "لون"(Loon) برای هدایت بالنهای اینترنت خود به سیستم ناوبری جدیدی روی آورده است.
این بالنها اکنون به جای تکیه بر الگوریتمهای طراحی شده توسط انسان، از سیستم هوش مصنوعی که در چند سال گذشته توسط گوگل توسعه یافته است، بهره میبرد.
اکنون یک سیستم یادگیری تقویتی(RL) وظیفه ناوبری این ناوگان از بالنها را در آسمان کشور کنیا بر عهده گرفته است، جایی که "لون" اولین سرویس تجاری خود را ارائه داد.
مسئولان این پروژه میگویند این اولین استفاده از مدل "RL" در یک سیستم تولیدی هوافضا است. آنها میگویند این کار هیجانانگیز است، زیرا نشان میدهد که یادگیری تقویتی میتواند در دنیای واقعی به کار گرفته شود.
گفتنی است که تاکنون از سیستمهای یادگیری تقویتی در شکست بازیکنان برتر بازیهای رایانهای استفاده شده بود.
این سیستم هوش مصنوعی میتواند مسیرهای بهینه را برای این بالنها که به طور قابل توجهی سریعتر از مسیرهای انتخابی سیستم ناوبری قبلی است، تعیین کند و این کار را با کارایی بیشتری انجام میدهد. همچنین این بالنها اکنون میتوانند مسافت مشابهی یا حتی بیشتری را با قدرت و صرف انرژی کمتری طی کنند.
رکورد پرواز "لون" 312 روز است که این رکورد را اوایل سال جاری بر جا گذاشت. اکنون شاید سیستم هوش مصنوعی بتواند این بالنها را برای مدت طولانیتری در آسمان نگه دارد.
"لون" و هوش مصنوعی گوگل قبل از شروع آزمایشها در دنیای واقعی در کشور پرو، از شبیه سازیهایی برای آموزش مدل یادگیری تقویتی از طریق آزمون و خطا استفاده کردند. سپس با انجام آزمایش 39 روزه بر فراز اقیانوس آرام، توانایی های این سیستم را در برابر الگوریتم های انسانی ارزیابی کردند و مشخص شد که هوش مصنوعی قادر است این بالن ها را مدت زمان طولانی تری در مناطق هدف نگه دارد و در عین حال انرژی کمتری مصرف می کند و همچنین از مانورهای پیچیده ای که قبلاً دیده نشده بود، استفاده کند.
این پیشرفت ها مهم است، زیرا به ارائه پوشش اینترنت به افراد در یک منطقه خاص کمک می کند.
انتهای پیام
اخبار مربوط به (یادگیری تقویتی) را دنبال کنید:
ربات 2پای چینی با موفقیت آزمایش شد
واژه شناسی این خبر (یادگیری تقویتی): ▲
یادگیری نیروافزوده یا یادگیری تقویتی یا یادگیری پاداش و تاوان یکی از گرایشهای یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام میگیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله، با توجه به گستردگیاش، در زمینههای گوناگونی بررسی میشود. مانند: نظریه بازیها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینهسازی بر مبنای شبیهسازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزهای که در آن روش یادگیری نیروافزوده مطالعه میشود برنامهنویسی تخمینی پویای (approximate dynamic programming) خوانده میشود. این مسئله در تئوری کنترل بهینه نیز مطالعه شدهاست. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگیهای آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری نیروافزوده در اقتصاد و نظریه بازیها بیشتر به بررسی تعادلهای ایجاد شده تحت عقلانیت محدود میپردازد.
(واژه یادگیری تقویتی از دانشنامه آزاد ویکیپدیا)
- قیمت طلای 18 عیار امروز پنجشنبه 9 فروردین 1403، 0.254 درصد افزایش داشت
- قیمت سکه گرمی امروز پنجشنبه 9 فروردین 1403، 1.429 درصد افزایش داشت
- قیمت یورو (مرکز مبادلات ارزی) امروز پنجشنبه 9 فروردین 1403، 0.069 درصد کاهش داشت
- شاخص USDINR امروز -0.01 درصد کاهش را تجربه کرد - چهارشنبه 8 فروردین 1403
- امروز چهارشنبه 8 فروردین 1403 تغییرات نرخ تبادلات دلار با پوند بدون تغییر ماند