بازارهای یادگیری ماشین مبتنی بر بلاکچین

ترکیب یادگیری ماشین و بلاکچین به تازگی متداول شده و پرهزینه ولی بسیار سودمند است. این مقاله به نحوه‌‌ کار آن‌‌ها و چالش‌‌های پیش روی آن‌‌ها اختصاص یافته و یک نمونه از آن‌‌ها به نام سیستم‌‌های توصیه‌‌گر نهایی را شرح می‌‌دهد. اساس کار این بازارها تجمیع ایده‌‌های مختلف در قالب مدل‌‌ها و درنهایت استفاده از بهترین آن‌‌ها در یک متامدل است.

0 166

مدل‌‌های یادگیری ماشین که بر روی داده‌‌های مبتنی بر بلاکچین کار می‌‌کنند، پتانسیل آن را دارند که قوی‌‌ترین هوش مصنوعی‌‌های جهان را بسازند. آن‌‌ها دو اصل را با هم ترکیب کرده‌اند: ماشین‌‌های یادگیری خصوصی؛ که برای کار با داده‌‌های خصوصی و حساس را بدن انتشار خود داده‌‌ها و محرک‌‌های مبتنی بر بلاکچین؛ که به این سیستم‌‌ها امکان جذب بهترین داده و مدل‌‌ها را برای هوشمندتر کردن آن‌‌ها می‌‌دهد. نتیجه‌‌ی این ترکیب کردن، یک بازار آزاد است که در آن هر کسی می‌‌تواند داده‌‌های خود را در عین خصوصی ماندن، به فروش برساند و سازندگان با محرک‌‌های مختلف بهترین داده برای الگوریتم خود را به خود جذب می‌‌کنند.

ساختن چنین سیستمی چالش برانگیز است و به ساخت بلوک‌‌ها نیاز داریم. ولی نسخه‌‌های ساده‌‌ی اولیه امکان‌‌پذیر بودن آن را نشان می‌‌دهد. من یقین دارم این بازارها ما را از وضعیت فعلی از حق انحصاری داده وب ۲ به وب ۳ منتقل می‌‌کند و رقابت آزاد داده و الگوریتم را امکان‌‌پذیر می‌‌کند.

مبدا

مبنای این ایده به صحبت‌‌های ریچارد (Richard) از شرکت نومرایی (Numerai) بر می‌‌گردد. نومرایی یک صندوق سرمایه‌‌گذاری است که داده‌‌ی بازارهای کریپتو را به هر متخصص داده‌‌ای که مایل به رقابت برای مدلسازی بازار سهام است می‌‌فرستد. نومرایی بهترین مدل‌‌ها را ترکیب می‌‌کند و یک متامدل (metamodel) می‌‌سازد، با آن تجارت می‌‌کند و به هر متخصصی که مدلش بهترین کارکرد را دارد حقوق می‌‌دهد.

رقابت متخصصان داده یک ایده‌‌ی قوی است. پس به فکر فرو رفتم: آیا امکان ساخت یک نسخه‌‌ی کاملا غیر متمرکز از این سیستم که بتواند هر مشکلی را حل کند، وجود دارد؟ فکر می‌‌کنم جواب این سوال بله است.

ساختار

به عنوان مثال، می‌‌خواهیم یک سیستم کاملا غیر متمرکز برای مبادله‌‌ ارزهای رمزنگاری‌‌شده در صرافی‌‌های غیر متمرکز بسازیم. این ساختار یکی از ساختارهای محتمل برای این مسئله است:

داده: داده‌‌های سهام در اختیار مدلسازان قرار می‌‌گیرد.

ساخت مدل: مدلسازان نوع داده‌‌ مورد نیاز برای ساخت مدلشان را انتخاب می‌‌کنند. آزمایش داده‌‌ها با یک روش محاسباتی امن بدون انتشار خود داده‌‌ها انجام می‌‌شود. خود مدلسازان نیز سهام‌‌گذارند.

metamodel

ساخت متامدل: یک متامدل بر اساس الگوریتمی که سهام‌‌گذاری در هر مدل را شرح می‌‌دهد، ساخته می‌‌شود.

ساخت یک متامدل دلخواه است. می‌‌توانید بدون ترکیب مدل‌‌ها در یک متامدل از آن‌‌ها استفاده کنید.

استفاده از متامدل: یک قرارداد هوشمند با مکانیزم آن-چین در یک صرافی غیر متمرکز از متامدل برای مبادلات خود استفاده می‌‌کند.

توزیع سود و زیان: پس از گذشت مدتی، سود یا زیان را در تجارت خود شاهد هستیم. این ضرر یا سود بین سازندگان متامدل تقسیم شده و از سازندگان مدل‌‌هایی که در متامدل تاثیر منفی داشته‌اند به نسبت تاثیر، سهام کم می‌‌شود.

محاسبات قابل اثبات: در هر گام محاسبات متمرکز ولی قابل اثبات و چالش‌‌برانگیز انجام می‌‌شود. محاسبات در یک بازی مثل تروبیت (Truebit) یا با روش‌‌های چندوجهی و غیر متمرکز انجام می‌‌شود.

مهمان‌‌داری: داده و مدل‌‌ها در IPFS یا با نودها در یک شبکه‌‌ی محاسبه‌‌ی چندوجهی امن مهمان می‌‌شوند. لازم به ذکر است ذخیره به صورت آن-چین گران تمام می‌‌شود.

چه چیزی این سیستم را قوی می‌‌کند؟

انگیزه‌‌هایی برای جذب بهترین داده‌‌ جهانی: انگیزه‌‌های جذب داده مهم‌‌ترین امتیاز این سیستم است و می‌‌تواند به عنوان عامل محدودکننده در بسیاری از ماشین‌‌های یادگیری باشد.. در عین حال بیت کوین نیز یک سیستم فوری با قوی‌‌ترین کامپیوتر جهان برای محرک‌‌های آزاد ساخته است. با این ساختار مهندسی‌‌شده و مناسب داده‌‌ها می‌‌توانید بهترین داده‌‌های مناسب کاربرد مورد نظرتان را پیدا کنید. و با خاموش کردن کامپیوتر، انتقال داده از هزاران یا میلیون‌‌ها منبع قطع نخواهد شد.

رقابت بین الگوریتم‌‌ها: با وجود این بازارها رقابت‌‌های آزاد بین مدل/الگوریتم‌‌ها در جاهایی که قبلا وجود نداشت، ایجاد می‌‌شود. مثلا فیسبوک می‌‌تواند با وجود رقابت بین هزاران الگوریتم فید، غیر متمرکز شود.

شفافیت در جوایز: از آنجایی که تمام محاسبات معتبر است، سازندگان داده‌‌ها و مدل‌‌ها می‌‌توانند ارزش واقع‌‌بینانه‌‌ محصولات خود را مشاهده کنند. به همین دلیل بسیاری از مردم به شرکت در این رقابت تشویق می‌‌شوند.

اتوماسیون: مشارکت آن-چین و تولید مستقیم توکن‌‌ها، یک حلقه‌‌ بسته، بدون نیاز به اعتماد و خودکار را ایجاد می‌‌کند.

تاثیرات شبکه: شبکه‌‌های چندوجهی از کاربران، سازندگان داده و متخصصان آن تاثیر می‌‌گیرند. آن‌‌ها یک سیستم خودتقویتی می‌‌سازند. عملکرد بهتر منجر به جذب سرمایه‌‌های بیشتر می‌‌شود. این یعنی پرداخت بهتر؛ و با پرداخت بهتر سازندگان داده و متخصصان بیشتری جذب می‌‌شوند و این یعنی سیستم هوشمندتر، جذب سرمایه‌‌ بیشتر و این مراحل تکرار می‌‌شود.

حریم خصوصی

علاوه بر نکات بالا، مهم‌‌ترین ویژگی این سیستم‌‌ها حریم خصوصی آن‌‌ها است. ۱- به مردم اجازه می‌‌دهد داده‌‌های خیلی خصوصی را که نباید منتشر شوند، انتخاب کنند. ۲- از کاهش ارزش اقتصادی داده و مدل‌‌ها جلوگیری می‌‌کند. اگر آن‌‌ها رمزنگاری نشده باشند، برای دیگران (که در هیچ جای کار مشارکتی نداشته‌اند) قابل کپی کردن هستند.

یکی از مشکلات این روش این است که هر کسی می‌‌تواند به طور خصوصی داده‌‌ها را به فروش برساند. اگر خریداران بخواهند داده‌‌ها را دوباره بفروشند و یا آن‌‌ها را منتشر کنند، به مرور زمان ارزش آن پایین می‌‌آید. اما به هر حال با این روش نمی‌‌توان به طور کوتاه‌‌مدت از داده استفاده کرد و محدودیت‌‌های حریم خصوصی را به نوبه‌‌ی خود دارد. در نتیجه پیچیده‌‌ترین و قوی‌‌ترین راه حل این است که محاسبات امن شوند.

محاسبات امن

داده‌‌ها بدون انتشار یافتن، با روش‌‌های محاسبات امن در مدل‌‌های مختلف آزمایش می‌‌شوند. ۳ نوع اصلی از محاسبات امن در دنیای امروز وجود دارد: رمزنگاری هم‌‌شکل (HE)، محاسبات چندوجهی امن (MPC)، اثبات دانایی صفر (ZKPs). در حال حاضر محاسبات چندوجهی متداول‌‌ترین روش برای یادگیری خصوصی ماشین است؛ زیرا رمزنگاری هم‌‌شکل سرعت کمی دارد و هم‌‌چنین مشخص نیست ZKPها چگونه در یادگیری ماشین کاربرد دارند. روش‌‌های محاسبات امن در حاشیه‌‌ی تحقیقات علوم کامپیوتر هستند، زیرا چند مرتبه آهسته‌‌تر از محاسبات معمولی‌اند. ولی در سال‌‌های اخیر پیشرفت خوبی داشته‌اند.

سیستم توصیه‌‌گر نهایی

برای اینکه پتانسیل‌‌های یک یادگیری ماشین خصوصی را نشان دهیم، یک اپلیکیشن به نام سیستم توصیه‌‌گر نهایی را فرض می‌‌کنیم. این اپلیکیشن تمام کارهای شما را در گوشی‌تان ضبط می‌‌کند: تاریخچه‌‌ی مرورگرتان، کارهایتان در اپلیکیشن‌‌های مختلف، تصاویر، مکان‌‌ها، تاریخچه‌‌ی مصرفتان، پیام‌‌های متنی، دوربین‌‌های خانه تان و دوربین‌‌های موجود در عینک‌‌های AR در آینده. سپس به شما توصیه می‌‌کند: صفحه‌‌ی وبی که در آینده می‌‌توانید از آن دیدن کنید، مقاله‌‌هایی که باید بخوانید، آهنگ‌‌هایی که دوست دارید گوش دهید یا محصولاتی که احتمالا می‌‌خرید.

این سیستم توصیه‌‌گر امکانات زیادی دارد. از آنجا که این سیستم دید طولی‌‌ از شما دارد و می‌‌تواند از داده‌‌هایی که آنقدر خصوصی هستند که قابل به اشتراک‌‌گذاری نیستند، یاد بگیرد، از بسیاری از منابع داده‌‌ی موجود در گوگل، فیسبوک و غیره بهتر عمل می‌‌کند. این سیستم می‌‌تواند همانند همان مثال قبلی در مورد سیستم مبادلات ارز رمز کار کند؛ در رابطه با موضوعات مختلف (مثل وبسایت، موزیک و غیره) مدل بسازد و بین آن مدل‌‌ها رقابتی برای دستیابی به داده‌‌های رمزنگاری‌‌شده‌‌ شما و پیشنهاد آن‌‌ها به شما برقرار کند. یا حتی می‌‌تواند به کاربرانی که داده‌‌ خود را در اختیار سیستم قرار می‌‌دهند پول بدهد.

اتحادیه‌‌ یادگیری گوگل و حریم خصوصی تفاضلی اپل گامی در جهت این ماشین یادگیری برداشته‌اند، اما هنوز توجه مردم را جلب نکرده‌اند و به کاربران اجازه‌‌ی راستی‌‌آزمایی امنیت داده‌‌هایشان را نداده‌اند.

روش‌‌های موجود

هنوز خیلی زود است. تعدادی از گروه‌‌ها هنوز کار زیادی نکرده‌اند و بسیاری می‌‌خواهند ره صدساله را یک شبه طی کنند.

یک تیم تحقیقاتی به نام الگوریتمیا (Algorithmia) به مدلی که به اندازه‌‌ یک حد آستانه‌‌ای دقیق باشد، پاداش می‌‌دهد:

Algorithmia

ساختار ساده‌‌ای که تیم تحقیقاتی الگوریتمیا برای یادگیری ماشین ساخته بود

نومرایی اکنون سه گام جلوتر است: با استفاده از داده‌‌های رمزگشایی‌‌شده (البته نه چندان هم‌‌شکل) مدل‌‌های حاصله را ترکیب کرده و به متامدل دست می‌‌یابد. در نهایت نه بر اساس سوابق که با یک توکن اتریوم به نام نومراییر (Numeraire) انجام می‌‌شود، بلکه به مدل‌‌هایی که بر اساس عملکرد آینده (مثلا یک هفته از مبادله‌‌ی سهام) کار می‌‌کند پاداش می‌‌دهد. متخصصان داده نومراییر را قبول ندارند و معتقدند مدل باید بر اساس اتفاقات آینده ساخته شود نه بر اساس اتفاقاتی که در گذشته افتاده (آزمایش سوابق (backtested)). اگر چه این کار داده‌‌ها را توزیع می‌‌کند و مواد لازم برای ساخت چنین مدلی محدود می‌‌شود.

هنوز کسی بازار موفقی برای داده که مبتنی بر بلاکچین باشد نساخته است. اوشن (Ocean) می‌‌تواند یکی از آن‌‌ها باشد.

بقیه‌‌ی شرکت‌‌ها هنوز در مرحله‌‌ی ساخت شبکه‌‌ی محاسباتی امن هستند. اپن مایند (Openmined) به همراه یونیتی (Unity) در حال ایجاد یک شبکه‌‌ محاسباتی چندوجهی برای آزمایش مدل‌‌های یادگیری ماشین هستند که قابل پیاده‌‌سازی بر روی همه‌‌ی دستگاه‌‌ها (از کنسول‌‌های بازی گرفته تا کامپیوترهای شخصی) باشد. انیگما (Enigma) نیز همین عملکرد را دارد.

نتیجه‌‌ دلخواه این کار این است: متامدل‌‌هایی با صاحبان مشترک که به سازندگان داده و مدل، به اندازه‌‌ی هوشمند بودن محصولشان، سهم می‌‌دهد. مدل‌‌ها در طول زمان ممکن است توکنیزه شوند، به سازندگان سود سهام بدهند یا توسط آزمایش‌‌کنندگانشان مدیریت شوند. ویدیوی رسمی اپن مایند نزدیک‌‌ترین ایده به این ساختار است.

کدام روش‌‌ها در ابتدا بکار گرفته می‌‌شوند؟

ادعا نمی‌‌کنم جواب این سوال را می‌‌دانم ولی فکرهایی در سر دارم.

یک ایده این است که در گستره‌‌ای که به ترتیب بومی فیزیکی، دیجیتالی و بلاکچینی است، هر چه بومی بلاکچینی بیشتر باشد بهتر است. هر چه بومی بلاکچینی کمتر باشد، اعتماد واسطه‌‌هایی که معرفی می‌‌شوند بیشتر می‌‌شود. در نتیجه با افزایش پیچیدگی استفاده از سیستم سخت‌‌تر می‌‌شود.

من فکر می‌‌کنم اگر ارزش محصول سنجیده شود، سیستم بهتر کار می‌‌کند. مبنای این سنجش می‌‌تواند به شکل پول، یا به بیان بهتر، توکن باشد. در نتیجه یک سیستم با حلقه‌‌ی بسته خواهیم داشت. مثال سیستم مبادله‌‌ی ارز رمز را با سیستم تشخیص تومور با اشعه‌‌ی ایکس مقایسه کنید. در سیستم تشخیص تومور با اشعه‌‌ی ایکس شما باید یک شرکت بیمه را توجیه کنید که مدل اشعه‌‌ی ایکستان ارزشمند است. در نهایت می‌‌توانید با کمک تعداد کمی از افرادی که در جلسه توجیهی‌‌تان حضور دارند موفقیت یا شکست مدل خود را اثبات کنید.

این به آن معنا نیست که برای جامعه مفید باشد. جامعه‌‌ای که هرگز در آن بومی دیجیتالی ظهور نخواهد کرد. سیستم‌‌هایی مانند سیستم‌‌های توصیه‌‌گر که قبلا گفتیم بسیار مفید هستند. بازارهای کوریشن هم یکی دیگر از مکان‌‌هایی است که مدل‌‌ها می‌‌توانند با برنامه‌‌ای آن-چین در آن فعالیت کنند. پاداش‌‌های این سیستم به شکل توکن است و در نهایت با ساخت یک حلقه‌‌ی بسته به مرحله‌‌ی اول برمی‌‌گردد.

اجرا

ابتدا بازارهای ماشین یادگیری غیر متمرکز امتیاز داده‌‌های حال حاضر را پیاده می‌‌کنند. با استانداردسازی و آماده‌‌سازی مواد لازم برای ساخت ارزش در اینترنت برای ۲۰ سال گذشته: شبکه‌‌های خصوصی داده و تاثیر قوی شبکه بر آن‌‌ها. در نتیجه با ایجاد ارزش، بار از دوش داده برداشته شده و بر شانه‌‌ی الگوریتم گذاشته می‌‌شود.

open standards and investment returns

چرخه‌‌های استانداردسازی و پیاده‌‌سازی. به انتهای شبکه‌‌های امتیازی رسیده‌ایم.

به بیان دیگر، آن‌‌ها یک مدل اشتغال مستقیم برای AI می‌‌سازند و هر دو وظیفه‌‌ی آموزش و تغذیه را انجام می‌‌دهند.

سپس در گام دوم قوی‌‌ترین سیستم AI در جهان را می‌‌سازند تا بهترین داده و مدلی که محرک‌‌های اقتصادی مستقیم را در خود دارد انتخاب کنند. قدرت آن‌‌ها با تاثیر شبکه‌‌های چندوجهی افزایش می‌‌یابد. شبکه‌‌ی داده‌‌ی انحصاری وب ۲ پیاده‌‌سازی شده و به عنوان نقطه‌‌ی تجمعی انتخاب می‌‌شوند. ما چند سالی از این پروژه عقبیم ولی در جهت درستی قرار گرفته‌ایم.

سوم، همانطور که مثال‌‌های سیستم توصیه‌‌گر نشان می‌‌دهند، جست‌‌وجو برعکس می‌‌شود. به جای آن که مردم به دنبال محصولات باشند، محصولات در جست‌‌وجوی مردم خواهند بود. هر کسی بازارهای کوریشن شخصی خود را ممکن است داشته باشد که در آن‌‌ها سیستم‌‌های توصیه‌‌گر برای یافتن مرتبط‌‌ترین موضوع رقابت می‌‌کنند.

در چهارمین مرحله، کاربران از سرویس‌‌های قدرتمند مبتنی بر یادگیری ماشین (مانند گوگل و فیسبوک) بدون لو رفتن داده‌‌هایشان بهره‌‌مند می‌‌شوند.

مرحله‌‌ی پنجم جایی است که یادگیری ماشین سریعا پیشرفت می‌‌کند، زیرا تمام مهندسان می‌‌توانند وارد این بازار آزاد شوند. در بازار وب ۲ تنها گروه‌‌های کمی از مهندسان امکان حضور داشتند.

چالش‌‌ها

اولین، مهم‌‌ترین و امن‌‌ترین روش‌‌های محاسباتی در حال حاضر بسیار آهسته هستند و یادگیری ماشین نیز به خودی خود پرهزینه است. به علاوه تمایل به استفاده از روش‌‌های محاسباتی امن بسیار شدت گرفته است. روش‌‌های ارزشمند و با عملکرد عالی‌‌ای مانند اچ ای (HE)، ام پی سی (MPC) و زد کی پی ها (ZKPs) در ۶ ماه اخیر ایجاد شده اند.

محاسبه‌‌ی ارزش یک مجموعه‌‌ی مشخص از داده یا مدل در یک متامدل بسیار دشوار است.

پاکسازی و یا مرتب‌‌سازی داده‌‌های به دست آمده نیز چالش‌‌برانگیز است. به نظر می‌‌آید ترکیبی از ابزارها، استانداردسازی‌‌ها و تبلیغات مشاغل کوچک راه حل این مشکل است.

در نهایت مدل اشتغال برای ایجاد ساختار کلی این نوع سیستم‌‌ها مبهم است. این ابهام شامل بازارهای کوریشن نیز می‌‌شود.

نتیجه

ترکیب یادگیری ماشین خصوصی با محرک‌‌های بلاکچین قوی‌‌ترین ماشین هوشمند و پرکاربرد در بسیاری از زمینه‌‌ها را می‌‌سازد. چالش‌‌های تکنیکی بسیاری بر سر راه آن‌‌ها قرار دارد که به نظر قابل حل می‌‌آیند. آن‌‌ها پتانسیل بالایی در طولانی‌‌مدت از خود نشان داده اند و از طرف بسیاری از شرکت‌‌های اینترنتی بزرگ برای گرفتن داده مورد استقبال واقع شده اند. این سیستم‌‌ها کمی عجیبند؛ ساختار خود تقویتی شان، استفاده از داده‌‌های خصوصی و عدم توقف حتی با خاموش کردن کامپیوتر مرا به تعجب وا می‌‌دارد که آیا ساختن این سیستم‌‌ها یک مولوخ (Moloch) قوی‌‌تر از پیش خواهد ساخت یا نه. به هر حال، آن‌‌ها نمایان‌‌گر نحوه‌‌ی کار آهسته‌‌ی رمز ارزها و ورود آن‌‌ها به صنعت هستند.

شاید از این مطالب هم خوشتان بیاید.

ارسال پاسخ

آدرس ایمیل شما منتشر نخواهد شد.