SpamScore: Верификация коллекций NFT на основе ИИ в Rarible
Обзор
SpamScore — специализированная подсистема микросервисов в инфраструктуре Rarible, предназначенная для автоматического выявления и пометки спам- и мошеннических коллекций NFT. Используя современные методы ИИ и машинного обучения, она предоставляет количественную оценку того, насколько коллекция легитимна или потенциально мошенническая.
Как это работает
Система оценивания
SpamScore присваивает каждой коллекции NFT числовое значение между 0 и 1:
- 0.00 - 0.79: Легитимная коллекция
- ≥ 0.80: Помечена как спам/скам
Любая коллекция с оценкой 0.80 или выше считается скамом и может быть отфильтрована или помечена на платформе Rarible.
Техническая архитектура
Система построена как микросервис со следующими ключевыми компонентами:
1. Основа ИИ
- Модель: OpenAI GPT-4o-mini
- Назначение: Анализирует характеристики коллекции и выполняет интеллектуальную классификацию
2. Векторные эмбеддинги
- Хранилище: pgvector (расширение PostgreSQL)
- Модель: OpenAI text-embedding-3-small
- Назначение: Создает семантические представления коллекций для поиска по схожести
3. Сбор данных
Для каждой коллекции система анализирует:
- Название коллекции
- Символ
- Описание
- Адрес создателя

Подход RAG
SpamScore реализует архитектуру Retrieval-Augmented Generation (RAG), которая объединяет:
Обучающий набор данных
Система обучена на 1,000 эталонных коллекциях:
- 500 «хороших» коллекций: Проверенные легитимные коллекции с SpamScore = 0
- 500 «плохих» коллекций: Известные спам/скам коллекции с SpamScore ≥ 0.80
Процесс
Векторизация: Все эталонные коллекции преобразуются в эмбеддинги и сохраняются в pgvector
Оценка новой коллекции: Когда обнаруживается новая коллекция:
- Извлекаются ее название, символ, описание и создатель
- Генерируются эмбеддинги для коллекции
- Извлекаются похожие коллекции из векторной базы данных
- GPT-4o-mini анализирует сходства и паттерны
- На основе анализа присваивается спам-оценка
Непрерывный мониторинг: Каждая новая коллекция на платформе оценивается автоматически
Почему RAG?
Подход RAG дает несколько преимуществ:
- Учет контекста: Сравнивает новые коллекции с известными хорошими и плохими примерами
- Семантическое понимание: Выходит за рамки совпадения ключевых слов, понимая смысл и намерение
- Масштабируемость: Эффективно обрабатывает большие объемы новых коллекций
- Адаптивность: Обновляется новыми примерами по мере эволюции спам-тактик
Влияние
Автоматизируя обнаружение спама, SpamScore помогает:
- Защищать пользователей от скам-коллекций
- Поддерживать качество платформы
- Снижать нагрузку на ручную модерацию
- Обеспечивать лучший пользовательский опыт на Rarible
Сводка технического стека
| Компонент | Технология |
|---|---|
| Модель ИИ | GPT-4o-mini |
| Эмбеддинги | text-embedding-3-small |
| Хранилище векторов | pgvector |
| Архитектура | Микросервис + RAG |
| Оценка | В реальном времени, автоматическая |
Примечание: Эта система представляет практическое применение современных методов ИИ (LLMs, эмбеддинги, RAG) для решения реальных задач в сфере Web3.