O que e o Sentence Space?
Sentence Space e um experimento/ferramenta que transforma frases em vetores e as mostra num espaco visual para voce ver, explorar e entender como uma IA as interpreta e organiza semanticamente.
O que fazemos?
Recebemos de 3 a 10 frases (do usuario) e transformamos cada frase em um vetor numerico (embedding) usando o modelo de embeddings do Gemini. Em seguida reduzimos a dimensionalidade desses vetores com UMAP para que possam ser desenhados em 2D. Depois aplicamos uma normalizacao para manter os pontos em uma escala consistente e comparavel.
Como funciona?
- Entrada: o usuario envia uma lista de frases.
- Embedding: cada frase e convertida em um vetor que captura seu significado semantico.
- Reducao (UMAP): esses vetores de alta dimensao sao projetados em 2 dimensoes por UMAP com foco em preservar relacoes semanticas locais.
- Normalizacao: centralizamos e ajustamos a escala dos pontos para facilitar leitura e comparacao.
- Exploracao: o usuario ve as frases no espaco, identifica grupos, similaridades e outliers.
E por que isso importa?
- Torna o abstrato visivel: embeddings sao numeros; aqui voce ve onde frases parecidas ficam proximas no espaco.
- Aprendizado e diagnostico: ajuda a entender modelos de linguagem, clusters semanticos e possiveis vieses.
- Prototipo pratico: inspiracao direta de como embeddings sao usados em chatbots e bancos vetoriais para busca por similaridade.
Inspiracao
A ideia nasceu do uso de embeddings para aproximacao semantica em chatbots e bancos de dados vetoriais. Durante um projeto de extensao no PET-Saude, precisei implementar um conjunto de FAQs em um banco de dados vetorial para alimentar um chatbot, e foi nesse processo que a intuicao por tras dos embeddings se tornou concreta: frases com significados proximos ocupam regioes proximas no espaco vetorial. Explicacoes didaticas normalmente ilustram isso com frases em um plano cartesiano; o Sentence Space e a versao pratica e interativa dessa ideia.