Sentence Space

O que e o Sentence Space?

Sentence Space e um experimento/ferramenta que transforma frases em vetores e as mostra num espaco visual para voce ver, explorar e entender como uma IA as interpreta e organiza semanticamente.


O que fazemos?

Recebemos de 3 a 10 frases (do usuario) e transformamos cada frase em um vetor numerico (embedding) usando o modelo de embeddings do Gemini. Em seguida reduzimos a dimensionalidade desses vetores com UMAP para que possam ser desenhados em 2D. Depois aplicamos uma normalizacao para manter os pontos em uma escala consistente e comparavel.

Como funciona?

  1. Entrada: o usuario envia uma lista de frases.
  2. Embedding: cada frase e convertida em um vetor que captura seu significado semantico.
  3. Reducao (UMAP): esses vetores de alta dimensao sao projetados em 2 dimensoes por UMAP com foco em preservar relacoes semanticas locais.
  4. Normalizacao: centralizamos e ajustamos a escala dos pontos para facilitar leitura e comparacao.
  5. Exploracao: o usuario ve as frases no espaco, identifica grupos, similaridades e outliers.

E por que isso importa?

  • Torna o abstrato visivel: embeddings sao numeros; aqui voce ve onde frases parecidas ficam proximas no espaco.
  • Aprendizado e diagnostico: ajuda a entender modelos de linguagem, clusters semanticos e possiveis vieses.
  • Prototipo pratico: inspiracao direta de como embeddings sao usados em chatbots e bancos vetoriais para busca por similaridade.

Inspiracao

A ideia nasceu do uso de embeddings para aproximacao semantica em chatbots e bancos de dados vetoriais. Durante um projeto de extensao no PET-Saude, precisei implementar um conjunto de FAQs em um banco de dados vetorial para alimentar um chatbot, e foi nesse processo que a intuicao por tras dos embeddings se tornou concreta: frases com significados proximos ocupam regioes proximas no espaco vetorial. Explicacoes didaticas normalmente ilustram isso com frases em um plano cartesiano; o Sentence Space e a versao pratica e interativa dessa ideia.