SpamScore: Verificação de Coleções NFT com IA na Rarible

Visão geral

SpamScore é um subsistema de microsserviço especializado dentro da infraestrutura da Rarible, projetado para identificar e sinalizar automaticamente coleções de NFTs de spam e golpes. Ao aproveitar técnicas avançadas de IA e aprendizado de máquina, ele fornece uma avaliação quantitativa sobre se uma coleção é legítima ou potencialmente fraudulenta.

Como funciona

O sistema de pontuação

O SpamScore atribui a cada coleção de NFT um valor numérico entre 0 e 1:

0.00 - 0.79: Coleção legítima
≥ 0.80: Marcada como spam/golpe

Qualquer coleção com pontuação de 0.80 ou superior é considerada um golpe e pode ser filtrada ou sinalizada na plataforma Rarible.

Arquitetura técnica

O sistema é construído como um microsserviço com os seguintes componentes principais:

1. Base de IA

Modelo: GPT-4o-mini da OpenAI
Finalidade: Analisa as características da coleção e faz classificações inteligentes

2. Embeddings vetoriais

Armazenamento: pgvector (extensão do PostgreSQL)
Modelo: text-embedding-3-small da OpenAI
Finalidade: Cria representações semânticas de coleções para correspondência por similaridade

3. Coleta de dados

Para cada coleção, o sistema analisa:

Nome da coleção
Símbolo
Descrição
Endereço do criador

A abordagem RAG

O SpamScore implementa uma arquitetura de Geração Aumentada por Recuperação (RAG), que combina:

Conjunto de treinamento

O sistema foi treinado com 1.000 coleções de referência:

500 "boas" coleções: Coleções legítimas verificadas com SpamScore = 0
500 "más" coleções: Coleções conhecidas como spam/golpe com SpamScore ≥ 0.80

Fluxo do processo

Vetorização: Todas as coleções de referência são convertidas em embeddings e armazenadas no pgvector
Avaliação de nova coleção: Quando uma nova coleção é detectada:
- Extrair seu nome, símbolo, descrição e criador
- Gerar embeddings para a coleção
- Recuperar coleções semelhantes do banco vetorial
- Usar o GPT-4o-mini para analisar similaridades e padrões
- Atribuir uma pontuação de spam com base na análise
Monitoramento contínuo: Toda nova coleção na plataforma é automaticamente avaliada

Por que RAG?

A abordagem RAG oferece várias vantagens:

Ciente do contexto: Compara novas coleções com exemplos bons e ruins conhecidos
Compreensão semântica: Vai além da correspondência por palavras-chave para entender significado e intenção
Escalável: Pode lidar eficientemente com grandes volumes de novas coleções
Adaptável: Pode ser atualizada com novos exemplos à medida que as táticas de spam evoluem

Impacto

Ao automatizar a detecção de spam, o SpamScore ajuda a:

Proteger usuários de coleções fraudulentas
Manter a qualidade da plataforma
Reduzir a sobrecarga de moderação manual
Proporcionar uma melhor experiência do usuário na Rarible

Resumo da pilha técnica

Componente	Tecnologia
Modelo de IA	GPT-4o-mini
Embeddings	text-embedding-3-small
Armazenamento vetorial	pgvector
Arquitetura	Microsserviço + RAG
Avaliação	Em tempo real, automatizada

Nota: Este sistema representa uma aplicação prática de técnicas modernas de IA (LLMs, embeddings, RAG) para resolver problemas do mundo real no espaço Web3.

SpamScore: Verificação de Coleções NFT com IA na Rarible ​

Visão geral ​

Como funciona ​

O sistema de pontuação ​

Arquitetura técnica ​

1. Base de IA ​

2. Embeddings vetoriais ​

3. Coleta de dados ​

A abordagem RAG ​

Conjunto de treinamento ​

Fluxo do processo ​

Por que RAG? ​

Impacto ​

Resumo da pilha técnica ​