SpamScore: Верификация коллекций NFT на основе ИИ в Rarible

Обзор

SpamScore — специализированная подсистема микросервисов в инфраструктуре Rarible, предназначенная для автоматического выявления и пометки спам- и мошеннических коллекций NFT. Используя современные методы ИИ и машинного обучения, она предоставляет количественную оценку того, насколько коллекция легитимна или потенциально мошенническая.

Как это работает

Система оценивания

SpamScore присваивает каждой коллекции NFT числовое значение между 0 и 1:

0.00 - 0.79: Легитимная коллекция
≥ 0.80: Помечена как спам/скам

Любая коллекция с оценкой 0.80 или выше считается скамом и может быть отфильтрована или помечена на платформе Rarible.

Техническая архитектура

Система построена как микросервис со следующими ключевыми компонентами:

1. Основа ИИ

Модель: OpenAI GPT-4o-mini
Назначение: Анализирует характеристики коллекции и выполняет интеллектуальную классификацию

2. Векторные эмбеддинги

Хранилище: pgvector (расширение PostgreSQL)
Модель: OpenAI text-embedding-3-small
Назначение: Создает семантические представления коллекций для поиска по схожести

3. Сбор данных

Для каждой коллекции система анализирует:

Название коллекции
Символ
Описание
Адрес создателя

Подход RAG

SpamScore реализует архитектуру Retrieval-Augmented Generation (RAG), которая объединяет:

Обучающий набор данных

Система обучена на 1,000 эталонных коллекциях:

500 «хороших» коллекций: Проверенные легитимные коллекции с SpamScore = 0
500 «плохих» коллекций: Известные спам/скам коллекции с SpamScore ≥ 0.80

Процесс

Векторизация: Все эталонные коллекции преобразуются в эмбеддинги и сохраняются в pgvector
Оценка новой коллекции: Когда обнаруживается новая коллекция:
- Извлекаются ее название, символ, описание и создатель
- Генерируются эмбеддинги для коллекции
- Извлекаются похожие коллекции из векторной базы данных
- GPT-4o-mini анализирует сходства и паттерны
- На основе анализа присваивается спам-оценка
Непрерывный мониторинг: Каждая новая коллекция на платформе оценивается автоматически

Почему RAG?

Подход RAG дает несколько преимуществ:

Учет контекста: Сравнивает новые коллекции с известными хорошими и плохими примерами
Семантическое понимание: Выходит за рамки совпадения ключевых слов, понимая смысл и намерение
Масштабируемость: Эффективно обрабатывает большие объемы новых коллекций
Адаптивность: Обновляется новыми примерами по мере эволюции спам-тактик

Влияние

Автоматизируя обнаружение спама, SpamScore помогает:

Защищать пользователей от скам-коллекций
Поддерживать качество платформы
Снижать нагрузку на ручную модерацию
Обеспечивать лучший пользовательский опыт на Rarible

Сводка технического стека

Компонент	Технология
Модель ИИ	GPT-4o-mini
Эмбеддинги	text-embedding-3-small
Хранилище векторов	pgvector
Архитектура	Микросервис + RAG
Оценка	В реальном времени, автоматическая

Примечание: Эта система представляет практическое применение современных методов ИИ (LLMs, эмбеддинги, RAG) для решения реальных задач в сфере Web3.

SpamScore: Верификация коллекций NFT на основе ИИ в Rarible ​

Обзор ​

Как это работает ​

Система оценивания ​

Техническая архитектура ​

1. Основа ИИ ​

2. Векторные эмбеддинги ​

3. Сбор данных ​

Подход RAG ​

Обучающий набор данных ​

Процесс ​

Почему RAG? ​

Влияние ​

Сводка технического стека ​