خوشه بندی آدرس های اتریوم

یکی از ویژگی‌های متفاوت فناوری بلاک چین نسبت به تکنولوژی‌های مشابه، امکان فعالیت ناشناس بر روی آن است. با این حال کاربران از آدرس‌هایی استفاده می‌کنند که شناسه‌هایی منحصر به فرد و غیرقابل تغییر هستند. در این مقاله با استفاده از خوشه بندی یا کلاسترینگ (Clustering) آدرس‌های اتریوم و تحلیل رفتار کاربران براساس فعالیت آن‌ها، امکان دسته‌بندی و شناسایی آن‌ها مورد بررسی قرار می‌گیرد.

0 94

خوشه بندی آدرس های اتریوم

کاربران اتریوم ممکن است ناشناس باشند، اما آدرس های آن‌ها دارای شناسه‌های منحصر به فردی هستند که اثری قابل‌مشاهده برای عموم را از خود بر روی بلاک چین به جا می‌گذارند.

من یک الگوریتم خوشه بندی براساس میزان فعالیت تراکنش ایجاد کردم که کاربران اتریوم را به زیرگروه‌های رفتاری متمایزی تقسیم‌بندی می‌کند. این الگوریتم می‌تواند پیش‌بینی کند که آیا یک آدرس به یک صرافی رمز ارز، یک استخراج‌کننده و یا یک کیف پول ICO تعلق دارد.

پایگاه داده با استفاده از SQL و مدل آن با زبان پایتون (Python) کدنویسی شده است. کد منبع (source code) بر روی گیت‌هاب (GitHub) در دسترس است.

خوشه بندی آدرس‌های اتریوم

نمایشی سه‌بعدی از فضای آدرس های اتریوم با استفاده از T-SNE

تاریخچه

بلاک چین اتریوم، پلتفرمی برای اپلیکیشن‌های غیرمتمرکز است که قراردادهای هوشمند نامیده می‌شوند. این قراردادها اغلب برای نمایندگی دیگر دارایی‌ها به کار می‌روند. چنین دارایی‌هایی می‌توانند معرف اشیای فیزیکی در جهان واقعی (مانند عناوین املاک) بوده یا کاملاً اشیایی دیجیتال (مانند توکن‌های ابزاری) باشند.

محاسبات بایستی قراردادهای هوشمندی را اجرا کنند که پرداخت آن‌ها با اتر (ether)، رمز ارز مختص به اکوسیستم اتریوم، صورت گرفته است.

اتر در حساب‌هایی امن از نظر رمزنگاری به نام آدرس‌ها ذخیره می‌شود.

انگیزه

بسیاری از افراد اعتقاد دارند که رمز ارزها امکان ناشناسی دیجیتال را مهیا می‌کنند و این اعتقاد تا حدودی صحیح است. در واقع، ناشناسی، ماموریت اساسی رمز ارزهای مونرو (Monero) و زی‌کش (ZCash) است.

با این حال، اتریوم به طور گسترده‌تری استفاده می‌شود و انعطاف‌پذیری زیاد آن منجر به شکل‌گیری یک مجموعه داده عمومی غنی از رفتار تراکنشی کاربران شده است. از آنجایی که آدرس های اتریوم ، شناسه‌های منحصر به فردی هستند که مالکیتشان تغییر نمی‌کند، فعالیت آن‌ها قابل پیگیری، جمع‌آوری و تحلیل است.

در اینجا، من سعی کردم تا نمونه‌هایی اولیه از کاربری را با استفاده از خوشه بندی موثر فضای آدرس اتریوم ایجاد کنم. این نمونه‌ها می‌توانند برای پیش‌بینی مالکیت یک آدرس نامعلوم به کار برده شوند.

این قابلیت بازه‌ای وسیع از کاربردها را به روی ما می‌گشاید:

  • فهمیدن فعالیت شبکه
  • بهبود استراتژی‌های معاملاتی
  • بهبود فعالیت‌های AML

نتایج

مشارکت‌کنندگان در اکوسیستم اتریوم را می‌توان براساس الگوهای موجود در فعالیت تراکنشی آن‌ها جدا کرد. آدرس های شناخته‌شده‌ای که به صرافی‌ها، استخراج‌کننده‌ها و ICOها تعلق دارند، به طور کیفی نشان می‌دهند که نتایج خوشه بندی دقیق هستند.

خوشه بندی آدرس‌های اتریوم

جزئیات فنی

مهندسی ویژگی

مجموعه داده‌ تراکنشی اتریوم بر روی Google BigQuery میزبانی می‌شود. با استفاده از 40000 آدرس با بیشترین موجودی اتر، من 25 ویژگی برای مشخص‌کردن تفاوت‌ها در رفتار کاربران ایجاد کردم.

خوشه بندی آدرس‌های اتریوم

ویژگی‌هایی که برای هر آدرس استخراج شده‌اند

انتخاب تعدادی مناسب از خوشه‌ها

با بهره‌گیری از روش تحلیل نیمرخ (silhouette)، من تعداد خوشه‌های بهینه را تقریباً 8 به دست آوردم.

این انتخاب، تعداد نمونه‌هایی با امتیاز نیمرخ منفی را به حداقل می‌رساند که نشان می‌دهند یک نمونه ممکن است به خوشه‌ اشتباهی نسبت داده شده باشد.

خوشه بندی آدرس‌های اتریوم

اما چگونه می‌فهمیم که این فرآیند درست عمل می‌کند؟

با استفاده از داده‌های دور ریخته‌شده‌ یک جستجوگر بلاک به نام Etherscan.io، من برچسب‌های جمع‌سپاری‌شده برای 125 آدرس در مجموعه داده‌ خودم را جمع‌آوری کردم.

عمده‌ی برچسب‌ها در سه دسته‌بندی قرار می‌گیرند:

صرافی‌ها، استخراج‌کننده‌ها و کیف پول‌های ICO.

خوشه بندی یک تکنیک یادگیری ماشین نظارت‌ناپذیر است، به همین خاطر من نمی‌توانم برچسب‌ها را برای آموزش مدلم به کار ببرم. در عوض، من آن‌ها را برای اختصاص نمونه‌کاربرها به خوشه‌ها براساس بیشترین پراکندگی برچسب برای هر خوشه استفاده کردم. نتایج را می‌توان در اینجا پیدا کرد.

خوشه بندی آدرس‌های اتریوم

خوشه بندی آدرس‌های اتریوم

نمایشی دوبعدی از نتایج نهایی خوشه بندی. آدرس های معلوم سمت چپ هستند.

تفسیر نتایج

ما می‌توانیم درباره رفتار کاربر با استفاده از سانتروئیدهای خوشه‌ مربوط به آن نتیجه‌گیری کنیم.

خوشه بندی آدرس‌های اتریوم

نمودار رادار، ویژگی‌های آدرس برای هر سانتروئید خوشه

صرافی‌ها

  • موجودی بالای اتر
  • حجم بالای تراکنش‌های ورودی و خروجی
  • زمان‌بندی بسیار نامنظم میان تراکنش‌ها

صرافی‌ها، بانک‌های فضای رمزنگاری هستند. این نتایج با درک شهودی تطابق دارند.

استخراج‌کننده‌ها

  • موجودی پایین اتر
  • کوچک‌بودن مقدار میانگین تراکنش
  • زمان‌بندی منظم‌تر میان تراکنش‌ها

استخراج‌کننده‌ها با صرف قدرت محاسباتی بلاک چین را امن کرده و پاداش آن‌ها با اتر داده می‌شود. گروهی از استخراج‌کنندگان اغلب منابع خود را « استخر » می‌کنند تا اختلاف پرداخت‌ها را کاهش دهند؛ درآمد حاصله براساس سهم هر کس از منابع تقسیم‌بندی می‌شود.

کیف پول‌های ICO

  • موجودی بالای اتر
  • تعداد کم تراکنش‌های بزرگ
  • زمان‌بندی منظم‌تر میان تراکنش‌ها

عرضه اولیه سکه (ICO ها) یک روش رایج جذب سرمایه برای استارتاپ‌های کریپتو هستند. منطقی است که چنین استارتاپ‌هایی معمولاً منابع زیادی دارند و به طور مرتب مقادیر بالایی را می‌فروشند تا هزینه‌های معمول کسب و کارشان را پوشش دهند.

دیگر دسته‌بندی‌ها

  • خوشه‌های صرافی و استخراج‌کننده بسیار شبیه یکدیگرند، به طوری که هر دوی آن‌ها در دور دوم خوشه بندی ایجاد شده‌اند.
  • آدرس های خوشه‌ی 7 میزان فعالیت بالایی در قالب قراردادهای هوشمند دارند.
  • خوشه‌های 2 و 5 بسیار متمایزند.

آیا شما می‌توانید هیچ کدام از این گروه‌های کاربری را شناسایی کنید؟

خوشه بندی آدرس‌های اتریوم

خوشه بندی آدرس‌های اتریوم

خوشه بندی آدرس‌های اتریوم

قدم‌های بعدی

گسترش این کار می‌تواند دید دقیق‌تری از داده‌های بلاک چین اتریوم را به دست دهد. تعدادی از حوزه‌های بسیار جالب عبارتند از:

افزودن ویژگی‌ها براساس نظریه‌ گراف و تحلیل شبکه

  • تشخیص روبات‌ها از انسان‌ها
  • گسترش تحلیل قرارداد هوشمند
  • تکرار تحلیل برای فعالیت تراکنش توکن ERC-20

منبع

شاید از این مطالب هم خوشتان بیاید.

ارسال پاسخ

آدرس ایمیل شما منتشر نخواهد شد.