Skip to content

SpamScore: Верификация коллекций NFT на основе ИИ в Rarible

Обзор

SpamScore — специализированная подсистема микросервисов в инфраструктуре Rarible, предназначенная для автоматического выявления и пометки спам- и мошеннических коллекций NFT. Используя современные методы ИИ и машинного обучения, она предоставляет количественную оценку того, насколько коллекция легитимна или потенциально мошенническая.

Как это работает

Система оценивания

SpamScore присваивает каждой коллекции NFT числовое значение между 0 и 1:

  • 0.00 - 0.79: Легитимная коллекция
  • ≥ 0.80: Помечена как спам/скам

Любая коллекция с оценкой 0.80 или выше считается скамом и может быть отфильтрована или помечена на платформе Rarible.

Техническая архитектура

Система построена как микросервис со следующими ключевыми компонентами:

1. Основа ИИ

  • Модель: OpenAI GPT-4o-mini
  • Назначение: Анализирует характеристики коллекции и выполняет интеллектуальную классификацию

2. Векторные эмбеддинги

  • Хранилище: pgvector (расширение PostgreSQL)
  • Модель: OpenAI text-embedding-3-small
  • Назначение: Создает семантические представления коллекций для поиска по схожести

3. Сбор данных

Для каждой коллекции система анализирует:

  • Название коллекции
  • Символ
  • Описание
  • Адрес создателя

img1

Подход RAG

SpamScore реализует архитектуру Retrieval-Augmented Generation (RAG), которая объединяет:

Обучающий набор данных

Система обучена на 1,000 эталонных коллекциях:

  • 500 «хороших» коллекций: Проверенные легитимные коллекции с SpamScore = 0
  • 500 «плохих» коллекций: Известные спам/скам коллекции с SpamScore ≥ 0.80

Процесс

  1. Векторизация: Все эталонные коллекции преобразуются в эмбеддинги и сохраняются в pgvector

  2. Оценка новой коллекции: Когда обнаруживается новая коллекция:

    • Извлекаются ее название, символ, описание и создатель
    • Генерируются эмбеддинги для коллекции
    • Извлекаются похожие коллекции из векторной базы данных
    • GPT-4o-mini анализирует сходства и паттерны
    • На основе анализа присваивается спам-оценка
  3. Непрерывный мониторинг: Каждая новая коллекция на платформе оценивается автоматически

Почему RAG?

Подход RAG дает несколько преимуществ:

  • Учет контекста: Сравнивает новые коллекции с известными хорошими и плохими примерами
  • Семантическое понимание: Выходит за рамки совпадения ключевых слов, понимая смысл и намерение
  • Масштабируемость: Эффективно обрабатывает большие объемы новых коллекций
  • Адаптивность: Обновляется новыми примерами по мере эволюции спам-тактик

Влияние

Автоматизируя обнаружение спама, SpamScore помогает:

  • Защищать пользователей от скам-коллекций
  • Поддерживать качество платформы
  • Снижать нагрузку на ручную модерацию
  • Обеспечивать лучший пользовательский опыт на Rarible

Сводка технического стека

КомпонентТехнология
Модель ИИGPT-4o-mini
Эмбеддингиtext-embedding-3-small
Хранилище векторовpgvector
АрхитектураМикросервис + RAG
ОценкаВ реальном времени, автоматическая

Примечание: Эта система представляет практическое применение современных методов ИИ (LLMs, эмбеддинги, RAG) для решения реальных задач в сфере Web3.