Qué es Typesense
Qué es Typesense
Typesense es un motor de búsqueda de código abierto, tolerante a errores tipográficos y optimizado para experiencias de búsqueda instantánea (normalmente menos de 50 ms) en aplicaciones web y móviles.
Se trata de una alternativa de código abierto a Algolia o ElasticSearch que destaca por su diseño simple y su facilidad de integración. Esto aumenta significativamente la productividad de los desarrolladores a la hora de implementar experiencias de búsqueda en sus aplicaciones.
Typesense es muy eficiente en la búsqueda, permitiendo consultas rápidas y precisas incluso en conjuntos de datos extensos, ya que puede escalar horizontalmente para manejar grandes volúmenes de datos y consultas. Además, está diseñado para admitir búsquedas en varios idiomas, lo que lo hace versátil en aplicaciones y sitios web multilingües.
Características de Typesense
- Tolerancia a errores tipográficos: maneja los errores tipográficos de forma elegante y lista para usar.
- Simple y encantador: fácil de configurar, integrar, operar y escalar.
- Increíblemente rápido: Construido en C++. Meticulosamente diseñado desde cero para búsquedas instantáneas de baja latencia (
- Clasificación ajustable: Es fácil adaptar los resultados de búsqueda a la perfección.
- Clasificación: Ordene dinámicamente los resultados según un campo particular en el momento de la consulta (útil para funciones como "Ordenar por precio (asc)").
- Facetado y filtrado: profundice y refine los resultados.
- Agrupación y distinción: agrupe resultados similares para mostrar más variedad.
- Búsqueda federada: busque en varias colecciones (índices) en una única solicitud HTTP.
- Búsqueda geográfica: busque y ordene por resultados alrededor de una latitud/longitud o dentro de un cuadro delimitador.
- Búsqueda de vectores: indexe incrustaciones de sus modelos de aprendizaje automático en Typesense y realice una búsqueda del vecino más cercano. Se puede utilizar para crear búsquedas de similitudes, búsquedas semánticas, búsquedas visuales, recomendaciones, etc.
- Búsqueda semántica/híbrida: genere automáticamente incrustaciones desde Typesense utilizando modelos integrados como S-BERT, E-5, etc. o utilice OpenAI, PaLM API, etc., tanto para consultas como para datos indexados. Esto le permite enviar datos JSON a Typesense y crear una experiencia de búsqueda semántica + búsqueda de palabras clave lista para usar.
- Claves API con alcance: genere claves API que solo permitan el acceso a ciertos registros, para aplicaciones multiinquilino.
- Sinónimos: defina las palabras como equivalentes entre sí, por lo que la búsqueda de una palabra también arrojará resultados para los sinónimos definidos.
- Curación y comercialización: impulse registros concretos a una posición fija en los resultados de búsqueda para destacarlos.
- Clustering: configure un clúster distribuido que tenga alta disponibilidad.
- Actualizaciones de versiones sin interrupciones: a medida que aparecen nuevas versiones de Typesense, la actualización es tan simple como cambiar el binario y reiniciar Typesense.
- Sin dependencias de tiempo de ejecución: Typesense es un binario único que puede ejecutar localmente o en producción con un solo comando.
Casos de uso de Typesense
Typesense fué creado principalmente para búsquedas de texto completo rápidas y tolerantes a errores tipográficos. Sin embargo, existen otros casos de uso, más allá de la simple búsqueda donde esta potente tecnología demuestra su versatilidad.
Estos son algunos casos de uso en los que se puede utilizar Typesense:
- Búsqueda difusa tolerante a errores tipográficos para potenciar las barras de búsqueda de autocompletar y las páginas de resultados de búsqueda.
- Navegación por facetas y experiencia de navegación , donde los usuarios no necesitan escribir una palabra clave, sino que directamente comienzan a aplicar filtros para profundizar en múltiples atributos para llegar a los documentos que están buscando.
- Como caché distribuido geográficamente , para colocar los datos cerca de los usuarios. En lugar de acceder a su base de datos principal para obtener datos que probablemente estén alojados en una única región geográfica, dado que ya envía a Typesense una instantánea de sus datos, puede recuperar documentos directamente desde un clúster de Typesense distribuido geográficamente , que enruta las solicitudes al nodo más cercano al usuario, reduciendo así la latencia.
- Para buscar documentos similares entre sí mediante la búsqueda vectorial. La definición de "similitud" se puede definir mediante cualquier modelo de ML que cree, tomaría la salida del modelo (vectores), los indexaría en Typesense y luego haría una búsqueda del vecino más cercano. Con esto, puede implementar funciones como personalización, recomendaciones, búsqueda visual, búsqueda semántica, búsqueda de similitudes, etc.
- Búsqueda multiinquilino , donde solo determinados conjuntos de usuarios pueden acceder a determinados registros/campos (por ejemplo, usuarios que han iniciado sesión, administradores, usuarios con un determinado plan de precios, etc.)
- Búsqueda federada , donde la búsqueda se realiza en varios índices y los resultados se muestran a los usuarios uno al lado del otro.
- Geobúsqueda , para buscar/ordenar registros que se encuentran cerca de una latitud/longitud determinada.
- Búsqueda semántica , donde los usuarios pueden escribir una palabra clave conceptualmente relacionada y Typesense devolverá resultados de su conjunto de datos, incluso si esa palabra clave exacta no existe. Por ejemplo, digamos que un usuario busca "océano" y su conjunto de datos solo tiene la palabra clave "mar", la búsqueda semántica aún puede recuperar resultados relevantes que contengan la palabra "mar".
- Memoria a largo plazo para LLM basados en chat como ChatGPT. Las funciones de búsqueda vectorial y búsqueda híbrida de Typesense se pueden utilizar para hacer que Chat LLM responda a las preguntas de los usuarios con información en su conjunto de datos JSON. Con esto, puede crear bots de chat conversacionales a partir de su conjunto de datos.
- Para potenciar visualizaciones de datos como gráficos y tablas, utilizando las métricas de facetas agregadas devueltas por Typesense.