SpamScore: Verificação de Coleções NFT com IA na Rarible
Visão geral
SpamScore é um subsistema de microsserviço especializado dentro da infraestrutura da Rarible, projetado para identificar e sinalizar automaticamente coleções de NFTs de spam e golpes. Ao aproveitar técnicas avançadas de IA e aprendizado de máquina, ele fornece uma avaliação quantitativa sobre se uma coleção é legítima ou potencialmente fraudulenta.
Como funciona
O sistema de pontuação
O SpamScore atribui a cada coleção de NFT um valor numérico entre 0 e 1:
- 0.00 - 0.79: Coleção legítima
- ≥ 0.80: Marcada como spam/golpe
Qualquer coleção com pontuação de 0.80 ou superior é considerada um golpe e pode ser filtrada ou sinalizada na plataforma Rarible.
Arquitetura técnica
O sistema é construído como um microsserviço com os seguintes componentes principais:
1. Base de IA
- Modelo: GPT-4o-mini da OpenAI
- Finalidade: Analisa as características da coleção e faz classificações inteligentes
2. Embeddings vetoriais
- Armazenamento: pgvector (extensão do PostgreSQL)
- Modelo: text-embedding-3-small da OpenAI
- Finalidade: Cria representações semânticas de coleções para correspondência por similaridade
3. Coleta de dados
Para cada coleção, o sistema analisa:
- Nome da coleção
- Símbolo
- Descrição
- Endereço do criador

A abordagem RAG
O SpamScore implementa uma arquitetura de Geração Aumentada por Recuperação (RAG), que combina:
Conjunto de treinamento
O sistema foi treinado com 1.000 coleções de referência:
- 500 "boas" coleções: Coleções legítimas verificadas com SpamScore = 0
- 500 "más" coleções: Coleções conhecidas como spam/golpe com SpamScore ≥ 0.80
Fluxo do processo
Vetorização: Todas as coleções de referência são convertidas em embeddings e armazenadas no pgvector
Avaliação de nova coleção: Quando uma nova coleção é detectada:
- Extrair seu nome, símbolo, descrição e criador
- Gerar embeddings para a coleção
- Recuperar coleções semelhantes do banco vetorial
- Usar o GPT-4o-mini para analisar similaridades e padrões
- Atribuir uma pontuação de spam com base na análise
Monitoramento contínuo: Toda nova coleção na plataforma é automaticamente avaliada
Por que RAG?
A abordagem RAG oferece várias vantagens:
- Ciente do contexto: Compara novas coleções com exemplos bons e ruins conhecidos
- Compreensão semântica: Vai além da correspondência por palavras-chave para entender significado e intenção
- Escalável: Pode lidar eficientemente com grandes volumes de novas coleções
- Adaptável: Pode ser atualizada com novos exemplos à medida que as táticas de spam evoluem
Impacto
Ao automatizar a detecção de spam, o SpamScore ajuda a:
- Proteger usuários de coleções fraudulentas
- Manter a qualidade da plataforma
- Reduzir a sobrecarga de moderação manual
- Proporcionar uma melhor experiência do usuário na Rarible
Resumo da pilha técnica
| Componente | Tecnologia |
|---|---|
| Modelo de IA | GPT-4o-mini |
| Embeddings | text-embedding-3-small |
| Armazenamento vetorial | pgvector |
| Arquitetura | Microsserviço + RAG |
| Avaliação | Em tempo real, automatizada |
Nota: Este sistema representa uma aplicação prática de técnicas modernas de IA (LLMs, embeddings, RAG) para resolver problemas do mundo real no espaço Web3.