Skip to content

SpamScore: Verificação de Coleções NFT com IA na Rarible

Visão geral

SpamScore é um subsistema de microsserviço especializado dentro da infraestrutura da Rarible, projetado para identificar e sinalizar automaticamente coleções de NFTs de spam e golpes. Ao aproveitar técnicas avançadas de IA e aprendizado de máquina, ele fornece uma avaliação quantitativa sobre se uma coleção é legítima ou potencialmente fraudulenta.

Como funciona

O sistema de pontuação

O SpamScore atribui a cada coleção de NFT um valor numérico entre 0 e 1:

  • 0.00 - 0.79: Coleção legítima
  • ≥ 0.80: Marcada como spam/golpe

Qualquer coleção com pontuação de 0.80 ou superior é considerada um golpe e pode ser filtrada ou sinalizada na plataforma Rarible.

Arquitetura técnica

O sistema é construído como um microsserviço com os seguintes componentes principais:

1. Base de IA

  • Modelo: GPT-4o-mini da OpenAI
  • Finalidade: Analisa as características da coleção e faz classificações inteligentes

2. Embeddings vetoriais

  • Armazenamento: pgvector (extensão do PostgreSQL)
  • Modelo: text-embedding-3-small da OpenAI
  • Finalidade: Cria representações semânticas de coleções para correspondência por similaridade

3. Coleta de dados

Para cada coleção, o sistema analisa:

  • Nome da coleção
  • Símbolo
  • Descrição
  • Endereço do criador

img1

A abordagem RAG

O SpamScore implementa uma arquitetura de Geração Aumentada por Recuperação (RAG), que combina:

Conjunto de treinamento

O sistema foi treinado com 1.000 coleções de referência:

  • 500 "boas" coleções: Coleções legítimas verificadas com SpamScore = 0
  • 500 "más" coleções: Coleções conhecidas como spam/golpe com SpamScore ≥ 0.80

Fluxo do processo

  1. Vetorização: Todas as coleções de referência são convertidas em embeddings e armazenadas no pgvector

  2. Avaliação de nova coleção: Quando uma nova coleção é detectada:

    • Extrair seu nome, símbolo, descrição e criador
    • Gerar embeddings para a coleção
    • Recuperar coleções semelhantes do banco vetorial
    • Usar o GPT-4o-mini para analisar similaridades e padrões
    • Atribuir uma pontuação de spam com base na análise
  3. Monitoramento contínuo: Toda nova coleção na plataforma é automaticamente avaliada

Por que RAG?

A abordagem RAG oferece várias vantagens:

  • Ciente do contexto: Compara novas coleções com exemplos bons e ruins conhecidos
  • Compreensão semântica: Vai além da correspondência por palavras-chave para entender significado e intenção
  • Escalável: Pode lidar eficientemente com grandes volumes de novas coleções
  • Adaptável: Pode ser atualizada com novos exemplos à medida que as táticas de spam evoluem

Impacto

Ao automatizar a detecção de spam, o SpamScore ajuda a:

  • Proteger usuários de coleções fraudulentas
  • Manter a qualidade da plataforma
  • Reduzir a sobrecarga de moderação manual
  • Proporcionar uma melhor experiência do usuário na Rarible

Resumo da pilha técnica

ComponenteTecnologia
Modelo de IAGPT-4o-mini
Embeddingstext-embedding-3-small
Armazenamento vetorialpgvector
ArquiteturaMicrosserviço + RAG
AvaliaçãoEm tempo real, automatizada

Nota: Este sistema representa uma aplicação prática de técnicas modernas de IA (LLMs, embeddings, RAG) para resolver problemas do mundo real no espaço Web3.