یادگیری ماشینی کامپیوتر‌ها را قادر می‌سازد که بسیاری از کار‌هایی را که تاکنون افراد انجام می‌دادند بتواند انجام دهد. از رانندگی ماشین گرفته تا ترجمه‌ی گفتار. یادگیری ماشینی می‌تواند به کمک نرم‌افزار و درک دنیای واقعی و غیر پیشبینی تحول بزرگی را در هوش‌های مصنوعی انجام دهد. در ادامه با وینفون همراه باشید.

اما یادگیری ماشینی چیست و چه چیزی باعث رونق کنونی یادگیری ماشینی می‌شود. برای جواب به این سوالات با ما همراه باشید.

یادگیری ماشینی چیست؟

در سطح بسیار بالایی، یادگیری ماشین فرایند تدریس سیستم کامپیوتری است که چگونه می‌توان پیشبینی‌های دقیق را در هنگام تغذیه داده ها انجام داد. این پیش بینی‌ها می‌توانند پاسخ دهند که آیا قطعه ای از میوه در یک عکس موز یا سیب است یا افرادی را که در حال عبور از خیابان در جلوی ماشین شما که در حال حرکت است، شناسایی و به شما هشدار دهد، یا قسمتی از یک کتاب را یا برگه‌ی رزرو هتل را برای شما بخواند، یا اینکه آیا ایمیلی که برای شما ارسال‌شده یک اسپم است یا نه و تولیدکردن یک زیرنویس مختص شما هنگامی که درحال تماشای ویدیویی با زبان دیگر در یوتیوب هستید.

تفاوت کلیدی یادگیری ماشینی با نرم‌افزار‌های سنتی کامپیوتر این است که یک توسعه‌دهنده‌ی انسانی کد نوشتاری که به سیستم آموزش می‌دهد که میوه‌ی داخل تصویرسیب یاموز است را ننوشته است و تشخیص برعهده‌ی خود ماشین است. در عوض یک مدل یادگیری ماشینی به آن آموزش داده‌شده که چگونه بتوانند با تجزیه و تحلیل داده‌ها فرق بین یک موز یا سیب را در یک تصویر تشخیص بدهند و در این مثال به نظر می‌رسد که تعداد زیادی از این تصاویر را به خوبی تشخیص می‌دهد. داده‌ها و زیادی آن‌ها کلید اصلی ساختن یادگیری ماشینی است.

تفاوت بین هوش مصنوعی (AI) و یادگیری ماشینی در چیست؟

 

یادگیری ماشین ممکن است موفقیت بزرگی در آینده‌ی خود داشته باشد اما تنها یک روش برای دستیابی به هوش مصنوعی است. در هنگام تولید رشته‌ی AI (هوش مصنوعی) در دهه ی 1950، AI به عنوان ماشینی که توانایی انجام کاری را داشته باشد که معمولاً به هوش انسانی نیاز دارد، تعریف شد. سیستم های AI عموما حداقل برخی از صفات زیر را نشان می دهند: برنامه ریزی، یادگیری، استدلال، حل مساله، نمایش دانش، ادراک، حرکت و دستکاری و هوش اجتماعی و خلاقیت.

در کنار یادگیری ماشینی روش‌های مختلف دیگری برای ساخت هوش مصنوعی شامل محاسبات تکاملی وجود دارد که در آن الگوریتم‌ها برای تکامل راه‌حل‌های بهینه و سیستم‌های خبره مورد استفاده قرار می‌گیرند، که به آن‌ها اجازه می‌دهد که رفتار یک متخصص انسانی را در یک دامنه‌ی خاص تقلید کنند. به عنوان مثال یک سیستم خلبانی خودکار که می تواند هواپیما را به پرواز در آورد.

انواع اصلی یادگیری ماشینی کدامند؟

یادگیری ماشین به طور کلی به دو دسته اصلی یادگیری تحت نظارت و یادگیری نظارت نشده تقسیم می‌شوند.

یادگیری تحت نظارت چیست؟

این یادگیری به صورت اساسی با استفاده از مثال به ماشین‌ها آموزش می‌دهد. در طول آموزش برای یادگیری تحت نظارت، سیستم ها با مقادیر زیادی داده های برچسب گذاری شده روبرو هستند، به عنوان مثال تصاویری از ارقام دست نوشته که حاوی ارقام زیادی هستند و باید تشخیص دهند که کدام یک اعدادی هستند که منطبق بر چیزی هستند که به آن‌ها گفته شده است. با توجه به نمونه های کافی، یک سیستم یادگیری تحت نظارت می‌تواند خوشه‌های پیکسل‌ها و اشکال مربوط به هر عدد را شناسایی کند و در نهایت بتواند اعداد دست نوشته را تشخیص دهد، که می تواند بین اعداد 9 و 4 یا 6 و 8 قابل تشخیص باشد. با اینحال آموزش این سیستم‌ها به طور معمول نیازمند مقادیر زیادی از داده‌های برچسب‌دار است، برخی از سیستم‌ها نیازدارند که در معرض میلیون‌ها نمونه از این داده‌ها قرار بگیرند.

در نتیجه، مجموعه داده‌های مورد استفاده برای آموزش این سیستم‌ها می‌تواند وسیع باشد، برای مثال با مجموعه داده‌های Google Open Images که حاوی 9 میلیون عکس است یا یوتیوب که حاوی بیش از 8 میلیون ویدیو است یا  ImageNet که یکی از پایگاه‌های اولیه داده‌ی این نوع بیش از 14 میلیون عکس دسته بندی شده دارد. اندازه مجموعه داده های آموزشی همچنان رشد می کند، و فیس بوک اخیراً اعلام کرده است که 3،5 میلیارد تصویر در Instagram به طور عمومی در دسترس قرار گرفته است و از هشتگ‌های مرتبط با هر تصویر به عنوان برچسبها برای آن‌ها استفاده می‌کند. با استفاده از یک میلیارد از این عکس‌ها برای آموزش یک سیستم تشخیص این تصویر‌ها به رکورد 85.4 بر اساس معیاری که ImageNet ثبت کرده‌است، نیاز دارد.

فرایند پر زحمت برچسب زدن مجموعه داده های مورد استفاده در آموزش اغلب با استفاده از سرویس های crowdworking مانند Amazon Mechanical Turk انجام می‌شود که دسترسی به یک حوضه بزرگ برای کارهای کم هزینه در سراسر جهان را فراهم می‌کند. به عنوان مثال، ImageNet بیش از دو سال توسط نزدیک به 50،000 نفر جمع آوری شد، که عمدتاً از طریق آمازون مککرات ترک استخدام شد. با این حال، رویکرد فیس بوک یعنی استفاده از داده های عمومی موجود برای آموزش سیستم ها می‌تواند راهی جایگزین برای سیستم‌های آموزشی با استفاده از مجموعه داده های میلیارد دلاری بدون دشواری بارگزاری عکس‌ها بر برچسب دستی باشد.

یادگیری بدون نظارت چیست؟

در مقابل، الگوریتم های یادآوری بدون نظارت با شناسایی الگوها در داده‌ها، تلاش می‌کند تا شباهت‌هایی که داده‌ها با موارد مورد نیاز دارند به یک دسته‌بندی تقسیم کند. مثلا ممکن است در گوگل اخبار مواردی را که بیشتر سرچ کرده‌اید در اولیت نمایش شما قرار دهد یا داستان‌های مشابه را در گوگل برای شما دسته‌بندی کند. این الگوریتم برای مشخص کردن نوع خاصی از داده ها طراحی نشده است، بلکه به سادگی اطلاعاتی را می‌تواند با شباهت‌های که دارن دسته‌بندی کرد یا برای آنومالی‌هایی که ایستادگی دارند.

یادگیری نیمه نظارتی چیست؟

اهمیت مجموعه‌های عظیمی از اطلاعات برچسب گذاری شده برای آموزش سیستم‌های یادگیری ماشین ممکن است با توجه به افزایش یادگیری نیمه نظارتی در طول زمان کاهش یابد. همانطور که از نام آن پیداست، این رویکرد یادگیری نظارت شده و بدون نظارت را مخلوط می کند. این تکنیک به استفاده از مقدار کمی از داده‌های برچسب‌شده و مقدار زیادی از داده های بدون برچسب برای آموزش سیستم ها متکی استفاده می‌کند. داده‌های برچسب گذاری شده تا حدی مدل یادگیری ماشینی را آموزش می‌دهد و سپس مدل نیمه آموزش دیده برای برچسب گذاری داده‌های بدون برچسب، یک فرایند به نام شبه برچسب گذاری استفاده می‌کند. سپس مدل بر روی ترکیب حاصل از داده‌های نشانه گذاری شده و شبه برچسب گذاری شده آموزش داده می‌شود.

قابلیت دسترسی به یادگیری نیمه نظارت شده اخیرا توسط شبکه‌های Generative Adversarial Networks یا به طور مخفف (GANs) ارائه می‌شوند، که شبکه‌ها سیستم‌های یادگیری ماشینی هستند که می‌توانند از داده‌های برچسب گذاری شده برای تولید اطلاعات کاملا جدید استفاده کنند، به عنوان مثال برای ایجاد تصاویر جدید از Pokemon از تصاویر موجود آن، که به نوبه خود می‌تواند به آموزش یک مدل یادگیری ماشینی کمک کند، استفاده شده‌است. یادگیری نیمه نظارتی ممکن است تاثیر مهم‌تری نسبت به یادگیری تحت نظارت داشته باشد، زیرا دسترسی به مقدار زیادی از توان محاسباتی ممکن است برای آموزش موفق یادگیری ماشینی بهتر از دسترسی به مجموعه‌ی داده‌های بزرگ و برچسب‌دار باشد.

تقویت یادگیری چیست ؟

یکی از راه‌های تقویت یادگیری این است که برای مثال برای نحوه‌ی یادگیری یک بازی کامپیوتری قدیمی که قبلاً آن را بازی نکرده‌اید و قوانین و نحوه‌ی انجام بازی را نمی‌دانید، ابتدا به آن فکر می‌کنید. در حالی که ممکن است شما یک تازه‌کار باشید اما در نهایت با نگاه‌کردن به رابطه‌ی بین دکمه‌ها و بازی عملکرد شما بهتر و بهتر می‌شود تا جایی که بازی را یاد می‌گیرید.

یک نمونه از یادگیری تقویتی  Google DeepMind’s Deep Q-network است که انسان‌ها را در طیف گسترده‌ای از بازی‌های ویدیویی قدیمی مورد آموزش قرار می‌دهد. این سیستم از هر بازی پیکسلی تغذیه می‌کند و اطلاعات مختلفی را از وضعیت بازی، مانند فاصله‌ی بین اشیا و غیره را روی صفحی نمایش می‌دهد، و سپس آن را در نظر می‌گیرد که چه رابطه‌ای بین دکمه‌ها و انجام بازی وجود دارد و راه و روش انجام بازی را تجزیه و تحلیل می‌کند. پس از بازی کردن مراحل مختلف آن بازی، در نهایت سیستم یک مدل می‌سازد که در آن چگونگی جمع‌آوری حداکثر امتیازات بازی را به بازیکن نشان می‌دهد، برای مثل در بازی ویدیویی قدیمی Breakout، به بازیکن یاد می‌دهد که چه زمانی باید دست و پا بزند تا توپ را بگیرد.

یادگیری ماشینی تحت نظارت چگونه کار می‌کند؟

همه چیز با آموزش یک مدل یادگیری ماشین شروع می‌شود، این مدل یک تابع ریاضی است که قادر است بارها و بارها تغییر نحوه عملکرد دهد و آن را انجام دهد تا زمانی که داده‌های تازه‌ای بدست می‌آید که می‌توان با استفاده از آن‌ها پیش‌بینی دقیقی انجام داد. قبل از شروع آموزش، ابتدا باید انتخاب کنید که کدام داده‌ها برای جمع آوری و تصمیم گیری در مورد ویژگی‌های داده مهم هستند.

یک مثال فوق العاده ساده از ویژگی‌های داده‌ها در این توضیح توسط گوگل ارائه شده است، که در آن یک مدل یادگیری ماشین برای تشخیص تفاوت بین آبجو و شراب، بر اساس دو ویژگی، رنگ نوشیدنی و حجم الکلی آنها (ABV) آموزش داده شده‌است. با استفاده از یک طیف سنج برای اندازه گیری رنگ و هیدرومتر برای اندازه گیری محتوای الکل آنها، هر نوشیدنی به عنوان یک آبجو یا یک شراب برچسب گذاری شده و سپس داده های مربوطه جمع آوری می‌شود. یک نکته مهم برای یادآوری این است که داده‌ها باید متعادل باشند، در این مثال نمونه ای تقریباً برابر از آبجو و شراب باید وجود داشته باشند. سپس داده‌های جمع آوری شده به نسبت بزرگتری برای آموزش یعنی 70 درصد و سهم کمتری برای ارزیابی یعنی 30 درصد تقسیم‌بندی می‌شوند. این داده‌های ارزیابی می‌تواند مدل آموزش دیده را آزمایش کند تا به این نکته پی ببرد که به چه اندازه‌ای خوب است که بتواند آن را در تمام دنیا عرضه کند.

قبل از آموزش، به طور کلی، گام آماده‌سازی داده‌ها نیز وجود دارد، که در طی آن فرآیندهای مانند deduplication، عادی سازی و اصلاح خطا انجام می‌شود. گام بعدی انتخاب مدل مناسب یادگیری ماشین از طیف گسترده‌ای در دسترس است. هر کدام از نقاط قوت و ضعف بسته به نوع داده‌ها برخوردارند، مثلا بعضی از آنها برای رسیدگی به تصاویر، بعضی‌ها به متن و بعضی برای داده‌های صرفاً عددی مناسب هستند.

آموزش یادگیری ماشینی تحت نظارت چگونه کار می‌کند؟

 

اساساً، فرایند آموزش شامل مدل یادگیری ماشین به طور خودکار در عملکرد آن دخالت دارد تا زمانی که بتواند پیش‌بینی دقیقی از داده‌های در دسترس را به دست آورد، در مثال گوگل، برچسب نوشیدنی به عنوان آبجو یا شراب زمانی که مدل به داده‌هایی چون رنگ نوشیدنی و ABV دسترسی داشت، به درستی انجام می‌شد.

یک راه خوب برای توضیح روند آموزش این است که مثال را با استفاده از یک مدل ساده یادگیری ماشین، که به عنوان رگرسیون خطی با نزول شیب شناخته می‌شود، در نظر بگیریم. در مثال زیر، مدل برای تخمینی مقدار بستنی‌های فروخته شده بر اساس دمای محیط استفاده می‌شود. تصور کنید که این داده‌ها مقدار فروش بستنی را در دما‌های مختلف در گذشته نشان می‌دهد و این داده ها را با یکدیگر در یک نمودار پراکنده ترسیم می کند، اساساً پراکندگی نقطه‌های گسسته را ایجاد می‌کند.برای پیشبینی اینکه چه تعداد بستنی در آینده براساس الگوی درجه حرارت در فضای باز فروخته می‌شود، می توانید خطی را بکشید که از میان تمامی این نقاط عبور می‌کند، درست مانند تصویری که در زیر می‌بینید.

هنگامی که این کار انجام دادید، تعداد فروش بستنی را می‌توان در هر درجه حرارت از طریق پیدا کردن نقطه‌ای که در آن نقطه خط از دما و تعداد مشخص شده‌ی بستنی عبور می‌کند، بدست آورید و فروش تعداد بستنی را درآن دمای مربوطه پیش‌بینی کنید. استفاده از این روش برای آموزش مدل یادگیری ماشینی در این مثال یک مدل رگرسیون خطی است که شامل تنظیم موقعیت عمودی و شیب خطی است که در وسط همه نقاط در نمودار پراکنده قرار می‌گیرد. در هر مرحله از روند آموزش، فاصله عمودی هر یک از این نقاط از خط اندازه گیری می‌شود. اگر تغییر در شیب یا موقعیت خط در فاصله‌ی آن از این نقاط افزایش پیدا کند، شیب یا موقعیت خط در جهت مخالف تغییر می‌کند و یک اندازه‌گیری جدید به عمل می‌آید.

به این ترتیب، از طریق بسیاری از تنظیمات کوچک در شیب و موقعیت خط، خط حرکت را ادامه خواهد داد تا زمانی که نهایتاً در موقعیتی قرار بگیرد که مناسب برای توزیع در تمام این نقاط باشد، همانطور که در ویدیو زیر دیده می‌شود. هنگامی که این فرآیند آموزش کامل شد، می‌توان از این خط برای پیش‌بینی دقیق‌تر میزان تاثیر دما بر فروش بستنی استفاده کرد، و می‌توان گفت که این مثال یک آموزش یادگیری ماشینی است.

در حالی‌که آموزش برای مدل‌های پیچیده‌ی یادگیری ماشینی مانند آموزش شبکه‌های عصبی در چندین مورد متفاوت است در اینجا نیز از مدل نزول شیب استفاده می‌شود که در آن مقدار وزن‌ها به عنوان داده‌های ورودی پردازش می‌شوند، تا زمانی که خروجی مقادیر تولید شده توسط مدل تا حد ممکن نزدیک به آنچه که مورد نظر است، می باشد.

چگونه مدل‌های یادگیری ماشینی را ارزیابی کنیم؟

هنگامی که آموزش مدل کامل شد، مدل با استفاده از داده‌های باقی مانده که در طول آموزش مورد استفاده قرار نگرفته است، مورد ارزیابی قرار می‌گیرد و ارزیابی عملکرد واقعی آن ارائه می‌شود. برای بهبود عملکرد بیشتر، پارامترهای آموزشی را می‌توان تنظیم کرد. یک مثال مانند تغییر میزان ممکن است در هر مرحله در روند آموزش تغییر کند و برای این کار باید پارامترها را باید درست تنظیم کرد.

شبکه های عصبی چیستند و چگونه آموزش می‌دهند؟

یک گروه بسیار مهم الگوریتم برای یادگیری ماشین تحت نظارت و بدون نظارت شبکه های عصبی هستند. این شبکه‌های عصبی بخش عمده‌ای از یادگیری ماشین هستند و در حالی که مدل‌های ساده مانند رگرسیون خطی می‌توانند برای پیش بینی بر اساس تعداد کمی از ویژگی های داده استفاده شود، همانطور که مثال گوگل با آبجو و شراب نیز اینگونه است، شبکه‌های عصبی در هنگام برخورد با مجموعه های بزرگ داده‌ها با بسیاری از ویژگی های پیچیده وارد عمل می‌شوند و می‌توانند در این زمینه کارایی بی‌نظیری داشته‌باشند.

شبکه های عصبی، که ساختار آن به وضوح توسط مغز الهام گرفته شده است، لایه‌های الگوریتم های متصل شده‌ای هستند، به نام نورون، که داده‌ها را با خروج از یک لایه و ورود آن به لایه‌ی لایه بعدی انتقال می‌دهند. هر لایه می‌تواند برای شناخت ویژگی‌های مختلف داده‌های کلی مورد توجه قرار گیرد. برای نمونه، مثال استفاده از یادگیری ماشین را برای تشخیص شماره‌های دست نوشته بین 0 و 9 در نظر بگیرید. لایه اول در شبکه عصبی ممکن است رنگ پیکسل های فردی در تصویر را اندازه گیری کند، لایه دوم می تواند اشکال مانند خطوط و منحنی را مشخص کند، و لایه دیگر ممکن است برای تشخیص اعداد به دنبال گردی اعداد در پایین یا بالای آن‌ها باشد مانند اعداد 6 یا 9. همه‌ی این مسیر‌ها تا لایه‌ی نهایی به این جهت طی می‌شوند تا احتمال دهد که اعدادی را که شما نوشته‌اید بین 0 یا 9 قرا دارند یا نه و اگر اینگونه بود آن‌ها را جدا کند.

شبکه یاد می گیرد که چگونه هر جزء از اعداد را در طول فرایند آموزش تشخیص دهد و این کار به تدریج افزایش اهمیت داده‌ها از طریق جریان در لایه های شبکه مشخص می‌شود. در پایان هر چرخه آموزش، سیستم بررسی خواهد کرد که آیا خروجی نهایی شبکه نزدیکتر یا دورتر به آن چیزی است که مورد نظر است، به عنوان مثال شبکه بهتر یا بدتر در شناسایی شماره دست‌نویس 6 عمل کرده‌است. برای کم کردن اختلاف بین خروجی واقعی و خروجی مطلوب، سیستم از طریق شبکه‌های عصبی به عقب بر می‌گردد و وزنه‌های متصل به همه‌ی پیوند‌های بین لایه‌ها را به اندازه‌ای مشخصی تغییر می‌دهند که به آن bias می‌گویند. این فرایند propagation نامیده می‌شود.

در نهایت این فرایند بر روی ارزش‌هایی برای این وزن‌ها و biasها حل خواهد شد که به شبکه اجازه می‌دهد تا به طور قابل اعتمادی کاری را که به او واگزار شده‌است را به خوبی انجام دهد، مانند شناسایی اعداد دست نویس، و می‌توان گفت که شبکه می‌تواند “یاد بگیرد”.

یادگیری عمیق چیست و شبکه‌های عمیق عصبی چیستند؟

زیر مجموعه‌ای از یادگیری ماشین یادگیری عمیق است، که در آن شبکه‌های عصبی به تعداد زیادی از لایه‌هایی که با استفاده از مقادیر زیاد داده‌ها آموزش داده می‌شوند به شبکه های گسترده گسترش می‌یابند. این شبکه های عصبی عمیق هستند که باعث افزایش سرعت حرکت توانایی رایانه‌ها برای انجام وظیفه‌ای مانند تشخیص گفتار و بینایی کامپیوتر می‌شوند.

انواع مختلفی از شبکه‌های عصبی با نقاط قوت و ضعف متفاوت وجود دارند. شبکه عصبی Recurrent یک نوع شبکه عصبی است که به ویژه برای پردازش زبان و تشخیص گفتار مناسب است، در حالی که شبکه عصبی convolutional بیشتر در تشخیص تصویر استفاده می‌شود. طراحی شبکه‌های عصبی نیز در حال تحول است و محققان اخیراً طراحی کارآمد‌تری را برای یک نوع موثر از شبکه‌های عمیق عصبی به نام حافظه‌ی کوتاه مدت یا LSTM ابداع کرده‌اند که به آن اجازه میدهد با سرعت زیادی کار کند تا در سیستم‌هایی چون ترجمه‌ی گوگل (Google Translate) راه‌اندازی شود.

تکنیک الگوریتم تکاملی هوش مصنوعی حتی برای بهینه سازی شبکه‌های عصبی، به لطف یک فرایند به نام عصب شناسی، مورد استفاده قرار می گیرد. این روش اخیرا توسط آزمایشگاه‌های Uber AI ارائه شده‌است که مقالاتی در مورد استفاده از الگوریتم های ژنتیک برای آموزش شبکه‌های عصبی عمیق برای مشکلات یادگیری تقویت شده منتشر کرده‌است.

چرا یادگیری ماشینی بسیار موفقیت‌آمیز است؟

در حالی که یادگیری ماشینی یک تکنیک جدید محسوب نمی‌شود، علاقه به این رشته در سال‌های اخیر بسیار زیاد شده‌است. این تجدید حیات در پشت یک سری از پیشرفت ها قرار دارد، با یادگیری عمیق، رکوردهای جدیدی برای دقت در زمینه‌هایی مانند تشخیص گفتار و زبان و بینایی کامپیوتر ثبت شده‌است. آنچه که این موفقیت ها را ممکن ساخته است، عمدتاً دو عامل است؛ یکی از آنها حجم گسترده‌ای از تصاویر، گفتار، ویدئو و متن است که برای محققانی که به دنبال آموزش سیستم‌های یادگیری ماشین هستند، در دسترس هستند. اما مهمتر از این مورد این است که در دسترس بودن مقادیر زیادی از قدرت پردازش موازی، تواضع واحد‌های پردازش گرافیکی مدرن (GPU)، را می‌تواند به هم پیوند بزند تا نیروگاه‌های یادگیری ماشین را بسازند.

امروزه هر کسی با اتصال به اینترنت می‌تواند از این خوشه‌ها برای آموزش مدل‌های یادگیری ماشین از طریق خدمات ابری ارائه شده از سوی شرکت های آمازون، گوگل و مایکروسافت استفاده کند.

همانطور که استفاده از یادگیری ماشین شروع شده‌است، بنابراین شرکت‌ها در حال ایجاد سخت افزار ویژه‌ای برای اجرا و آموزش مدل های یادگیری ماشینی هستند. یکی از این نمونه‌ها تراشه‌های سفارشی یک واحد پردازش تانسور گوگل (TPU) است که آخرین نسخه آن سرعت یادگیری را افزایش می‌دهد که در آن مدل های یادگیری ماشین با استفاده از کتابخانه‌ی نرم افزاری TensorFlow Google می‌توانند اطلاعات را از داده‌ها استخراج کنند و همچنین به وسیله‌ی آن‌ها آموزش ببینند.

این تراشه ها نه تنها برای آموزش مدل های Google DeepMind و Google Brain استفاده می‌شوند، بلکه همچنین مدل‌هایی هستند که پشتیبان گوگل ترجمه و تشخیص تصویر در Google Photo هستند و همچنین خدماتیرا ارائه می‌دهند که به مردم امکان می‌دهد مدل های یادگیری ماشین را با استفاده از خدمات Cloud گوگل شاملGoogle’s TensorFlow بسازند. نسل دوم این تراشه ها در کنفرانس I / O گوگل در ماه می سال جاری رونمایی شدند .با مجموعه ای از این TPU های جدید قادر به آموزش یک مدل یادگیری ماشین گوگل برای ترجمه در نیمی از زمان هستید و همچنین اعلام شد که یک آرایه از بالا GPUها و پردازنده‌های نسل سوم که اخیراً اعلام شده‌اند قادر به تسریع در آموزش و حتی استنتاج بالاتری هستند.

همانطور که این سخت‌افزار‌ به طور فزاینده‌ای تخصصی شده‌است و چارچوب‌های نرم‌افزار یادگیری ماشینی در حال پردازش هستند، این سخت‌افزار با نام ML برای انجام وظایف به گونه‌ای فزاینده رایج میشوند تا بر روی تلفن های همراه و کامپیوتر‌ها به جای دیتاسنتر‌های cloud انجام وظیفه کنند.

در تابستان سال 2018 گوگل با ارائه‌ی یک ماشین ترجمه‌ی قوی، گامی بزرگ به سمت ارائه‌ی همان کیفیت ترجمه‌ی خودکاری که در برنامه‌های آفلاین گوشی‌های آندروید و iOS وجود دارد، برداشت. که به صورت آنلاین دسترسی به 59 زبان زنده‌ی دنیا را برای ترجمه در ترجمه‌گر گوگل را امکانپذیر می‌کرد.

ALPHAGO چیست؟

شاید معروفترین نمایش اثر‌بخشی سیستم یادگیری ماشینی هوش مصنوعی AlphaGo گوگل DeepMind در سال 2016 بود که بیش از یک استاد بزرگ انسانی در این بازی توانایی داشت. انتظار‌ها بر این بود که تا سال 2026 تکمیل نخواهد شد. Go یک بازی باستانی چینی بود که پیچدگی‌های آن کامپیوتر‌ها را بیش از یک دهه به خود مشغول کرده‌بود. در هر چرخش این بازی 200 حرکت می‌تواند انجامشود که در مقایسه با 20 حرکت در هر چرخش در شطرنج بسیار سخت و دشوار است.  در طی یک بازی Go، بسیاری از حرکت های احتمالی وجود دارد که از طریق هر کدام از آنها برای پیشبرد بهترین بازی ها از نظر محاسباتی بسیار پرهزینه است. در عوض، AlphaGo آموزش داده شد که چگونه بازی را با انجام کارهایی که توسط کارشناسان انسانی در 30 میلیون بازی Go انجام شده‌است ادامه‌دهد و آنها را در شبکه های عصبی عمیق یاد بگیرد.

آموزش شبکه‌های یادگیری عمیق می‌تواند زمانبسیار طولانی طول بکشد و نیاز به مقادیر زیادی داده‌ها برای مصرف و تکرار آن داشته باشد، چرا که سیستم به تدریج مدل خودرا اصلاح می‌کند تا به بهترین نتیجه برسد. با اینحال اخیراً گوگل روند آموزش با AlphaGo Zero، سیستمی که بازی کاملاً تصادفی را در برابر خود بازی انجام می‌دهد و سپس پس از دیدن نتایج آن شروع به یادگیری بازی می کند، را ارائه داده‌است. در کنفرانس سال گذشته‌ی شرکت معتبر پردازش اطلاعات عصبی (NIPS)،  مدیر عامل Google DeepMind دمیس حسابی گفت که AlphaGo  در بازی‌های شطرنج و shogi نیز به استاد تبدیل شده‌است و آن‌ها را نیز به خوبی یاد گرفته‌است.

DeepMind همچنان به ارائه‌ی زمینه‌ی جدیدی در یادگیری ماشینی ادامه داد. در ژوئیه 2018، DeepMind گزارش داد که عوامل هوش مصنوعی آن‌ها به خود یاد داده‌بودند که چگونه بازی Quake III Arena چند نفره 3D اول شخص را در سال 1999 به گونه‌ای انجام دهند که بتوانند تیم‌های انسانی در این بازی را شکست دهند.

اخیراً  DeepMind یک هوش مصنوعی را نشان داد که قادر به عملکرد فوق بشری در چندین بازی کلاسیک آتاری بود و بهبود بهتری را نسبت به رویکرد قبلی ارائه داد، در حالی که هر عمل هوش مصنوعی می‌توانسند تنها در یک بازی موفق عمل کنند. محققان  DeepMind می‌گویند که اگر این تحقیقات کلی روی هوش مصنوعی زمانی اهمییت خواهد داشت که بتوانند روی زمینه‌های پیچیده‌تری از دنیای واقعی موثر باشند.

یادگیری ماشینی برای چه چیزی استفاده می‌شود؟

سیستم‌های یادگیری ماشینی در تمامی اطراف ما مورد استفاده قرار می‌گیرند و پایه‌ای از اینترنت مدرن هستند. از سیستم‌های یادگیری ماشینی برای توصیه‌ی اینکه کدام محصول را ممکن است در سایت آمازون برای خرید بخواهید و یا قصد تماشای کدام ویدیو رادر سایت نتفلیکس دارید و هزاران مورد دیگر استفاده می‌شود.

هر جستجوی گوگل از چندین سیستم یادگیری ماشینی استفاده می‌کند تا زبان سرچ شما و همچنین چیزی را که می‌خواهید درک کند، بنابراین مشتاقان ماهیگیری هنگام سرچ کردن چیز‌های مورد نیازشان با چیز دیگری مانند گیتار روبه‌رو نمی‌شوند. به طور مشابه، سیستم های اسپم و جیمیل و از مدل‌های آموزش‌یافته‌ی یادگیری ماشین استفاده می‌کنند تا صندوق ورودی خود را از پیام های ناخواسته پاک کند. هنگام جستجو در گوگل نیز از یادگیری ماشینی برای نمایش دادن نتایج مشابه یا نزدیک به جستجوی شما استفاده می‌شود.

یکی از بارزترین نمونه‌ها در مورد یادگیری ماشینی، دستیاران  مجازی مانند Siri اپل، کورتانای کمپانی مایکروسافت، آلِکسا کمپانی آمازون و دستیار گوگل هستند. هر کدام به شدت متکی بر یادگیری ماشینی هستند تا قادر به تشخیص صدا و زبان طبیعی باشند و همچنین نیاز به یک پیکره‌ی زبانی بسیار بزرگ برای پاسخ دادن دارند تا به سوالاتی که از آن‌ها می‌شود جواب دهند.

اما فراتر از این تجلیلات مشهود در یادگیری ماشین، سیستم‌ها شروع به یافتن کاربرد درست خود در هر صنعت می‌کنند به این معنی که خود را وارد عرصه‌ی صنعت می‌کنند. این موارد عبارتند از: چشم‌انداز کامپیوتری برای اتومبیل‌های بدون راننده، هواپیما‌های بدون سرنشین و روبات‌های تحویل، تشخیص گفتار و جمله‌ها برای  chatbots و روبات‌های خدماتی، تشخیص چهره برای نظارت در کشور‌هایی مانند چین، کمک به رادیولوژیست‌ها برای تشخیص نوع تومورها در اشعه ایکس، کمک به محققان در تشخیص توالی‌های ژنتیکی مربوط به بیماری‌ها و شناسایی مولکول‌هایی که می‌تواند منجر به ساخت دارو‌های مؤثر در مراقبت‌های بهداشتی شوند؛ اجازه‌ی تعمیرات پیشگیرانه در زیرساخت‌ها با تجزیه و تحلیل داده‌های سنسوری IoT؛ ارائه‌ی پایه‌ای از دیدگاه کامپیوتری که امکان خرید و فروش در سوپرمارکت آمازون را بدون پرداخت نقدی فراهم می‌کند، ارائه دادن رونویس و ترجمه‌ی دقیق سخنرانی‌ها را در جلسات تجاری  و بسیاری از موارد دیگر که توسط این سیستم انجام می‌شوند.  

یادگیری عمیق در نهایت می‌تواند راه را برای روباتهایی که بتوانند به طور مستقیم از انسان یاد بگیرند، هموار کند. محققان Nvidia اخیراً یک سیستم یادگیری عمیق طراحی کرده‌اند تا به روبات آموزش دهند که چگونه کاری را انجام دهد صرفاً با تماشای اینکه این کار توسط انسان چگونه انجام می‌شود.

هدف سیستم یادگیری ماشینی چیست؟

 

همانطور که انتظار داشتید، انتخاب و وسعت داده‌هایی که برای آموزش سیستم‌ها استفاده می‌شود، کارهایی را که مناسب آن سیستم‌ها هستند تحت تاثیر قرار می‌دهد. به عنوان مثال، در سال 2016، راشل تاتمن، یکی از دانش پژوهان فارغ‌التحصیل علوم انسانی در اداره زبان شناسی دانشگاه واشنگتن، زمانی که یک نمونه از ویدیوهای یوتیوب را به صورت خودکار ضبط کرد، دریافت که سیستم تشخیص گفتار گوگل برای صدای مردانه بهتر از زنان است در نتیجه او آن را به “مجموعه های آموزشی نامتعادل” با غلبه بر سخنرانان مرد نسبت داد.

همانطور که سیستم‌های یادگیری ماشینی به سمت هدف‌های بزرگی مانند کمک به تشخیص پزشکی حرکت می‌کنند، احتمال وجود سیستم‌هایی که ارائه‌ی خدمات بهتر و عادلانه‌تری را در قبال گروه‌های خاصی از جامعه دارند به یک نگرانی جمعی تبدیل شده‌است.

کدام موارد در کمک به کسانی که یادگیری ماشینی را آموزش می‌دهند مفید است؟

یک دوره‌ی بسیار توصیه‌شده  برای مبتدی‌هایی که سیستم یادگیری ماشینی را آموزش می‌دهند حضور در دانشگاه اسمفورد یا دسترسی به مجموعه سخنرانی‌های Coursera است که متخصص هوش مصنوعی وموسس Google Brain به حساب می‌آید. یکی دیگر از دوره‌های رایگان تحسین‌شده برای مبتدیان آموزش یادگیری ماشینی، دانشگاه EdX و دانشگاه کلمبیا می‌باشند، اگرچه دانش‌آموختگان تاکید می‌کنند که حضور در این دانشگاه‌ها نیاز‌مند دانش جامع ریاضی دانشگاهی است.

چگونه می‌توان با یادگیری ماشینی شروع به کار کرد؟

فناوری‌هایی که به توسعه‌دهندگان اجازه می‌دهند تا به خودشان در مورد یادگیری ماشین آموزش دهند و با یادگیری ماشینی آشنا و با آن شروع به کار کنند به طور چشم‌گیری زیاد هستند، از دوربین های DeepLens با قابلیت فراگیری AWS  تا کیت‌های یادگیری هوش مصنوعی  Google’s Raspberry Pi-powered.

کدام سرویس‌ها برای یادگیری ماشینی در دسترس هستند؟

 

همه‌ی پایگاه‌های اصلی cloud شامل خدمات وب آمازون، مایکروسافت Azure و گوگل cloud امکان دسترسی به سخت‌افزار‌های مورد‌ نیاز برای آموزش و اجرای مدل‌های  یادگیری ماشینی را فراهم می کنند. برخی از تراشه‌های Google به کاربران Cloud Platform اجازه می‌دهد که Tensor خود را آزمایش کنند، تراشه‌هایی که طراحی آنها برای آموزش و اجرای مدل‌های یادگیری ماشینی بهینه شده‌است. این زیر ساخت‌ها مبتنی بر cloud شامل انبار‌های داده‌ مورد نیاز برای حجم عظیمی از داده‌های آموزشی، خدمات آماده‌سازی داده‌ها و ابزار تجسم برای نمایش واضح داده‌ها است. 

سرویس‌های جدیدتر حتی ایجاد مدل‌های یادگیری ماشین‌های شخصی را سادهتر می‌کنند، زیرا گوگل اخیراً سرویس هایی را ارائه کرده که به طور خودکار به ایجاد مدل های AI به نام Cloud AutML می‌پردازد. این سرویس کشیدن و رهاسازی، مدل‌های تشخیص تصویر دلخواه را ایجاد می‌کند و به کاربری که دارای مهارت یادگیری ماشین باشد، نیاز ندارد. مانند استودیوی یادیگیری ماشینی Azure مایکروسافت. مانند این کمپانی، آمازون اخیراً عرضه محصولات AWS جدیدی را که برای سرعت بخشیدن به روند آموزش مدل‌های یادگیری ماشین کارآمد است، به نمایش گذاشت.

برای دانشمندان داده‌ها، Google Cloud ML Engine یک سرویس مدیریت یادگیری ماشینی است که به کاربران اجازه می‌دهد تا آموزش، اعزام و صادرات مدل‌های یادگیری ماشین سفارشی را براساس چارچوب TensorFlow ML مبتنی بر منبع باز و یا Keras قاب شبکه باز عصبی Keras را پیاده‌کنند، که اکنون میتوان از طریق کتابخانه علمی-کیت پایتون و XGBoost مطالبی را در این مورد یاد بگیرند.

مدیران پایگاه داده بدون پس زمینه در علوم داده‌ها می‌توانند با استفاده از BigQueryML گوگل، از یک سرویس بتا استفاده کنند که به مدیران اجازه می‌دهد مدل‌های یادگیری ماشینی را با استفاده از دستورات SQL پیاده سازند، که این امکان را می‌دهد که پیش‌بینی در پایگاه داده انجام شود، که ساده‌تر از صادرات داده به یک محیط یادگیری ماشینی جداگانه و مستلزم تجزیه و تحلیل دوباره است.

برای شرکت هایی که نمی‌خواهند خود مدل‌های یادگیری ماشین را بسازند، سیستم عامل‌های ابر سرویس‌های تحت پلت‌فرم‌های AI، مانند تشخیص صدا و تصویر و زبان را ارائه می‌دهند. مایکروسافت اَژور برای دستیابی و ارائه‌ی خدمات خود باید تحت شبکه‌های گوگل  Cloud  و سپس AWS قرار گیرد. در عین حال IBM در تلاش است تا با فروش هوش‌های مصنوعی ویژه برای انجام خدمات در بسیاری از زمینه‌ها مانند خدمات درمانی و خرده فروشی وغیره بتواند نام این کمپانی یعنی IBM Watson را در این زمینه به همه بشناسند.

در اوایل سال 2018، گوگل سرویس‌های یادگیری ماشین خود را به دنیای تبلیغات گسترش داد، مجموعه وسیعی از ابزارهای تبلیغاتی موثر و دیجیتال و فیزیکی را عرضه کرد.

در حالی که اپل از همان شهرت برای پیشرفته‌تر شدن در زمینه‌های گفتار، پردازش زبان طبیعی و دید کامپیوتری به عنوان گوگل و آمازون برخوردار نیست، در حال سرمایه گذاری در بهبود خدمات AI خود است و برای این کار اخیراً مدیر سابق گوگل را در زمینه آموزش دستگاه و استراتژی AI در سراسر شرکت، از جمله توسعه دستیار آن یعنی سیری و خدمات پرس و جو دستگاه آموزش Core ML را استخدام کرده‌است.

در سپتامبر سال 2018، NVIDIA یک پلتفرم سخت‌افزاری و نرم‌افزاری را طراحی کرد تا بتواند در مرکز داده نصب شود که می‌تواند سرعت را افزایش دهد و در آن مدل‌های یادگیری ماشین‌های آموزش دیده می‌توانند صدای، ویدئو و تشخیص تصویر و همچنین سایر خدمات مربوط به ML را انجام دهند.

پلت‌فرم استنتاجی NVIDIA TensorRT Hyperscale   از پردازنده های NVIDIA Tesla T4 استفاده می‌کند که عملکرد پردازنده‌های آن را  در هنگام استفاده از مدل‌های یادگیری ماشین برای نتیجه‌گیری از داده ها تا 40 برابر افزایش می‌دهد و همچنین باعث افزایش سرعت پلت‌فرم نرم افزاری TensorRT که برای بهینه سازی عملکرد شبکه‌های عصبی آموزش دیده، می‌شود.

کدامیک از کتابخانه‌های نرم‌افزاری برای شروع آموزش یادگیری ماشینی در دسترس هستند؟

طیف گسترده ای از چارچوب های نرم افزاری برای شروع آموزش و اجرای مدل‌های یادگیری ماشین، معمولاً برای زبان‌های برنامه نویسی Python، R، C ++، Java و MATLAB وجود دارد. نمونه‌های مشهور عبارتند از TensorFlow گوگل، کتابخانه منبع باز Keras، کتابخانه پایتون Scikit-learn، چارچوب یادگیری عمیق CAFFE و Torch کتابخانه یادگیری ماشینی.

ما در این مقاله سعی کردیم که یادگیری ماشینی را بیشتر به شما معرفی کنیم تا اطلاعات بیشتری را از آن بدانید اگر شما در این مورد اطلاعات یا ایده و نظراتی دارید می‌توانید آن را با ما درمیان بزارید.

منبع :

ZDNET

83 پست
واحد عثمانی
مطالب مرتبط
در مای نوکیا بخوانید
دیدگاه کاربران
هنوز دیدگاهی ثبت نشده
برای نوشتن دیدگاه می توانید به حساب کاربری خود وارد شوید ورود ارسال نظر به صورت مهمان
برچسب ها: , , , , , , ,