Conectores
Los conectores definen cómo la plataforma se conecta a fuentes de datos externas. Cada tipo de conector tiene su propio método de autenticación, patrones de acceso a datos y funcionalidades.
Conectores Disponibles
PostgreSQL
El conector más maduro, con streaming completo, ingestión incremental y preview en tiempo real.
| Característica | Estado |
|---|---|
| Autenticación | Usuario/Contraseña |
| Navegador de Schemas | ✅ |
| Queries SQL Personalizadas | ✅ |
| Preview (enriquecido por IA) | ✅ |
| Ingestión Incremental | ✅ (basada en rastreo de cambios) |
| Ejecución Programada | ✅ |
Cómo funciona: La plataforma conecta a su base de datos PostgreSQL, ejecuta la query configurada (o extracción completa de la tabla), hace streaming de las filas como CSV y las importa a su almacén de datos.
Google Sheets
Conecte su cuenta Google vía OAuth para ingerir datos de hojas de cálculo de Google Sheets.
| Característica | Estado |
|---|---|
| Autenticación | OAuth 2.0 (Google) |
| Preview | ✅ |
| Ejecución Programada | ✅ |
| Ingestión Incremental | ❌ (extracción completa) |
Campos de configuración:
- Spreadsheet ID — Encontrado en la URL de la hoja:
docs.google.com/spreadsheets/d/SPREADSHEET_ID/edit - Range — ej:
Sheet1!A:Zo soloA:Zpara la hoja predeterminada
Cómo funciona: La plataforma usa la Google Sheets API v4 para leer los datos. La primera fila se trata como encabezado. Todas las filas siguientes se convierten a CSV y se envían al almacén de datos.
Microsoft (Excel / SharePoint)
Conecte su cuenta Microsoft 365 vía OAuth para acceder a archivos Excel Online, carpetas de SharePoint y listas de SharePoint.
| Característica | Estado |
|---|---|
| Autenticación | OAuth 2.0 (Microsoft) |
| Preview | ✅ |
| Ejecución Programada | ✅ |
| Ingestión Incremental | ❌ (extracción completa) |
Tres tipos de origen son soportados:
Archivo Excel
Lee un libro Excel específico de OneDrive o SharePoint.
Carpeta de SharePoint
Ingiere todos los archivos CSV y Excel de una carpeta de biblioteca de documentos de SharePoint.
Lista de SharePoint
Lee datos de una lista de SharePoint y los convierte a formato tabular.
MySQL (Parcial)
Configuración aceptada, pero la ejecución vía streaming SQL está pendiente de implementación.
SQL Server (Parcial)
Mismo estado que MySQL — la configuración de conexión funciona, ejecución pendiente.
API de Entrada (Push)
La plataforma actúa como servidor de API — sistemas externos envían datos a la plataforma a través de un endpoint webhook dedicado. Cada conexión recibe un token de ingestión único y revocable.
| Característica | Estado |
|---|---|
| Autenticación | Token de Ingestión (generado automáticamente, 256-bit) |
| Dirección | Push (externo → plataforma) |
| Preview | ✅ (últimos datos recibidos) |
| Ejecución Programada | N/A — orientado a eventos |
Cómo funciona: Cree una conexión API de Entrada, la plataforma genera una URL de endpoint única con token de ingestión. Los sistemas externos hacen POST de datos JSON al endpoint.
Cliente de API con IA (Pull)
Conéctese a cualquier REST API proporcionando su documentación y una descripción en lenguaje natural. La plataforma usa IA para generar automáticamente el código de integración.
| Característica | Estado |
|---|---|
| Autenticación | Bearer Token / API Key / Basic Auth / Header Personalizado |
| Dirección | Pull (plataforma → externo) |
| Generación de Código con IA | ✅ |
| Preview | ✅ |
| Ejecución Programada | ✅ |
| Revisión de Código | ✅ (usuario debe aprobar antes de programar) |
MCP Server (Entrada)
La plataforma expone un endpoint de servidor MCP (Model Context Protocol). Agentes de IA externos pueden descubrir y llamar herramientas exportadas por la plataforma.
| Característica | Estado |
|---|---|
| Autenticación | API Key (generada automáticamente) |
| Dirección | Entrada (agente externo → plataforma) |
| Protocolo | SSE (Server-Sent Events) |
MCP Client (Salida)
Conéctese a servidores MCP externos para descubrir y llamar sus herramientas para extracción de datos.
| Característica | Estado |
|---|---|
| Autenticación | Bearer Token (opcional) |
| Dirección | Salida (plataforma → servidor MCP externo) |
| Descubrimiento de Herramientas | ✅ (auto-descubierto en conexión) |
| Preview | ✅ |
| Ejecución Programada | ✅ |
Shopify
Ingiera datos de su tienda Shopify vía Admin API.
| Característica | Estado |
|---|---|
| Autenticación | Admin API Access Token |
| Objetos Soportados | Pedidos, Productos, Clientes, Ítems de Inventario, Colecciones |
| Preview | ✅ |
| Paginación | ✅ (basada en cursor vía header Link) |
| Ingestión Incremental | ✅ (vía rastreo updated_at) |
| Ejecución Programada | ✅ |
| Plan | Starter+ |
Campos de configuración:
- Dominio de la Tienda — ej:
mi-tienda.myshopify.com - Access Token — De una app personalizada Shopify (Admin API)
- Versión de API — Por defecto
2024-01
Cómo funciona: La plataforma llama a la Shopify Admin REST API, pagina por todos los registros usando paginación basada en cursor (header Link), aplana objetos anidados y envía los datos como CSV al almacén de datos.
Para obtener un access token:
- Vaya a Admin Shopify → Configuración → Apps y canales de venta → Desarrollar apps
- Cree una app personalizada y configure los scopes del Admin API (read_orders, read_products, etc.)
- Instale la app y copie el Admin API access token
Stripe
Ingiera datos de pago y facturación de Stripe.
| Característica | Estado |
|---|---|
| Autenticación | API Key Restringida (solo lectura) |
| Objetos Soportados | Cargos, Suscripciones, Clientes, Facturas, Pagos, Disputas, Productos, Precios |
| Preview | ✅ |
| Paginación | ✅ (basada en cursor vía starting_after) |
| Ingestión Incremental | ✅ (vía filtro de timestamp created) |
| Ejecución Programada | ✅ |
| Plan | Starter+ |
Campos de configuración:
- API Key — Clave restringida con permisos de solo lectura
Cómo funciona: La plataforma llama a la Stripe REST API con paginación basada en cursor, aplana objetos anidados (metadata, dirección, etc.) y envía al almacén de datos.
HubSpot
Ingiera datos de CRM de HubSpot.
| Característica | Estado |
|---|---|
| Autenticación | Access Token de App Privada |
| Objetos Soportados | Contactos, Empresas, Negocios, Tickets, Productos, Líneas de Pedido |
| Preview | ✅ |
| Paginación | ✅ (API de búsqueda basada en cursor) |
| Ingestión Incremental | ✅ (vía updatedAt) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- Access Token — De una app privada HubSpot
Cómo funciona: La plataforma usa la HubSpot CRM v3 Search API para paginar por los registros. Las propiedades se aplanan automáticamente del objeto properties anidado.
Para obtener un access token:
- Vaya a HubSpot → Configuración → Integraciones → Apps Privadas
- Cree una app privada con scopes de lectura de objetos CRM
- Copie el access token
TOTVS Protheus
Ingiera datos del sistema ERP TOTVS Protheus vía REST API.
| Característica | Estado |
|---|---|
| Autenticación | Basic Auth / Bearer Token / API Key |
| Entidades Soportadas | Clientes (SA1), Productos (SB1), Pedidos de Venta (SC5), Facturas (SF2), Financiero (SE1/SE2), personalizado |
| Preview | ✅ |
| Paginación | ✅ (basada en offset) |
| Mapeo de Campos | ✅ (mapear campos Protheus a nombres estándar) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- URL Base — ej:
https://protheus.empresa.com:8888 - Tipo de Autenticación — Basic, Bearer o API Key
- Ambiente / Empresa / Sucursal — Headers de contexto específicos de Protheus
Cómo funciona: La plataforma llama a la TOTVS Protheus REST API usando paginación por offset. Los endpoints de entidad preconfigurados (SA1, SB1, SC5, SF2, SE1, SE2) se mapean a objetos de negocio estándar. Se pueden especificar endpoints personalizados para entidades no estándar.
S3 / GCS (Bucket en la Nube)
Ingiera archivos de buckets Amazon S3 o Google Cloud Storage.
| Característica | Estado |
|---|---|
| Autenticación | Access Key (S3) / Service Account (GCS) |
| Formatos Soportados | CSV, JSON, JSONL |
| Preview | ✅ |
| Ingestión Multi-Archivo | ✅ |
| Compatible con S3 | ✅ (MinIO, DigitalOcean Spaces, etc.) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- Proveedor — S3 o GCS
- Nombre del Bucket — Bucket de destino
- Región — Región S3 (ej:
us-east-1) - Endpoint Personalizado — Para servicios compatibles con S3 como MinIO
Cómo funciona: La plataforma lista archivos en el bucket (filtrados por prefijo), descarga y analiza cada archivo, y luego envía los datos combinados al almacén de datos. Se agrega una columna _source_file para rastrear el origen de cada fila.
Salesforce
Ingiera datos de CRM y negocio de Salesforce usando queries SOQL.
| Característica | Estado |
|---|---|
| Autenticación | OAuth Access Token |
| Queries SOQL Personalizadas | ✅ |
| Objetos Soportados | Todos los objetos estándar y personalizados de Salesforce |
| Preview | ✅ |
| Paginación | ✅ (automática vía nextRecordsUrl) |
| Ingestión Incremental | ✅ (vía LastModifiedDate) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- Instance URL — ej:
https://miempresa.salesforce.com - Access Token — OAuth access token
- Versión de API — Por defecto
v59.0
Cómo funciona: La plataforma ejecuta queries SOQL contra la Salesforce REST API. Los resultados se paginan automáticamente usando nextRecordsUrl.
MongoDB
Ingiera documentos de MongoDB vía Atlas Data API.
| Característica | Estado |
|---|---|
| Autenticación | Atlas Data API Key |
| Queries Personalizadas | ✅ (filter, projection, sort) |
| Preview | ✅ |
| Ejecución Programada | ✅ |
| Plan | Starter+ |
Campos de configuración:
- Data API URL — Endpoint Atlas Data API
- API Key — Clave Data API
- Data Source — Nombre del cluster (ej:
Cluster0) - Database — Base de datos destino
Cómo funciona: La plataforma usa el endpoint /action/find del MongoDB Atlas Data API. Los tipos Extended JSON ($oid, $date, $numberDecimal) se convierten automáticamente a valores primitivos. Los arrays y objetos anidados se serializan como JSON en columnas string.
FTP / SFTP
Conéctese a servidores FTP o SFTP para ingerir archivos.
| Característica | Estado |
|---|---|
| Autenticación | Usuario/Contraseña o Clave Privada (SFTP) |
| Prueba de Conexión | ✅ (alcanzabilidad TCP) |
| Ejecución Completa | ⚠️ Requiere dependencia ssh2-sftp-client |
| Plan | Starter+ |
Nota: La ejecución completa de FTP/SFTP requiere los paquetes npm ssh2-sftp-client y basic-ftp instalados. La prueba de conexión solo verifica alcanzabilidad TCP.
BigQuery
Ejecute queries SQL en Google BigQuery e ingiera los resultados.
| Característica | Estado |
|---|---|
| Autenticación | Service Account JSON (JWT) |
| Queries SQL Personalizadas | ✅ |
| Preview | ✅ |
| Tipos de Schema | ✅ (preserva metadatos de tipo BigQuery) |
| Ejecución Programada | ✅ |
| Plan | Business+ |
Campos de configuración:
- Project ID — ID del proyecto GCP
- Service Account JSON — Clave de service account con rol BigQuery Reader
- Location — Ubicación del dataset BigQuery (ej:
US,EU)
Cómo funciona: La plataforma firma un JWT usando la clave del service account, lo intercambia por un access token, y luego ejecuta la query SQL vía BigQuery REST API. Los metadatos de schema se preservan.
Snowflake
Ejecute queries SQL en Snowflake e ingiera los resultados.
| Característica | Estado |
|---|---|
| Autenticación | Usuario/Contraseña o Par de Claves |
| Queries SQL Personalizadas | ✅ |
| Preview | ✅ |
| Ejecución Programada | ✅ |
| Plan | Business+ |
Campos de configuración:
- Account — Identificador de cuenta Snowflake (ej:
xy12345.us-east-1) - Username / Password — Credenciales Snowflake
- Warehouse — Warehouse de cómputo
- Database / Schema / Role — Contexto predeterminado
Cómo funciona: La plataforma envía queries SQL vía Snowflake SQL REST API (/api/v2/statements). Los resultados se devuelven sincrónicamente para queries pequeñas. Los nombres y tipos de columnas se extraen del resultSetMetaData.
SAP (OData)
Ingiera datos de sistemas SAP vía servicios OData.
| Característica | Estado |
|---|---|
| Autenticación | Basic Auth / OAuth / API Key |
| Queries OData | ✅ ($select, $filter, $expand) |
| Preview | ✅ |
| Paginación | ✅ ($skip/$top con conteo inline) |
| Ejecución Programada | ✅ |
| Plan | Business+ |
Campos de configuración:
- URL del Servicio OData — URL del servicio SAP Gateway
- Tipo de Autenticación — Basic, OAuth o API Key
- SAP Client — (opcional) Número de mandante (ej:
100)
Cómo funciona: La plataforma llama al servicio OData SAP con paginación $skip/$top, usando $inlinecount=allpages para determinar el conteo total de registros. Los objetos de metadatos (__metadata, __deferred) se eliminan automáticamente.
Kafka
Consuma mensajes de tópicos Kafka vía Confluent REST Proxy.
| Característica | Estado |
|---|---|
| Autenticación | SASL (PLAIN / SCRAM) |
| Protocolo | Confluent REST Proxy (v2) |
| Preview | ✅ |
| Control de Offset | ✅ (earliest / latest) |
| Ejecución Programada | ✅ |
| Plan | Business+ |
Campos de configuración:
- URL del REST Proxy — Endpoint del Confluent REST Proxy
- URL del Schema Registry — (opcional) Para deserialización Avro/Protobuf
- Credenciales SASL — (opcional) Usuario/contraseña
Cómo funciona: La plataforma crea una instancia de consumidor vía REST Proxy, se suscribe al tópico especificado, consume mensajes y luego limpia el consumidor. Los valores de los mensajes se aplanan desde JSON; los metadatos (tópico, partición, offset, clave, timestamp) se preservan.
Notion
Ingiera datos de bases de datos y páginas de Notion.
| Característica | Estado |
|---|---|
| Autenticación | Token de Integración |
| Objetos Soportados | Bases de datos, Páginas |
| Preview | ✅ |
| Paginación | ✅ (basada en cursor) |
| Ingestión Incremental | ✅ (vía last_edited_time) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- Token de Integración — De una integración Notion (
secret_...)
Cómo funciona: La plataforma consulta bases de datos Notion usando el endpoint /databases/{id}/query de la API. Los 18+ tipos de propiedad de Notion (título, rich_text, número, select, multi_select, fecha, checkbox, URL, email, teléfono, fórmula, relación, rollup, personas, archivos, created_time, last_edited_time, status) se aplanan automáticamente a valores escalares.
Para obtener un token de integración:
- Vaya a notion.so/my-integrations
- Cree una nueva integración
- Comparta la base de datos destino con la integración
Slack
Exporte mensajes, usuarios y canales de espacios de trabajo Slack.
| Característica | Estado |
|---|---|
| Autenticación | Bot User OAuth Token (xoxb-...) |
| Tipos de Datos | Mensajes, Usuarios, Canales |
| Preview | ✅ |
| Paginación | ✅ (basada en cursor) |
| Ingestión Incremental | ✅ (vía timestamp ts del mensaje) |
| Ejecución Programada | ✅ |
| Plan | Growth+ |
Campos de configuración:
- Bot Token — Slack Bot User OAuth Token (
xoxb-...)
Tipos de datos:
- Mensajes — Historial de mensajes del canal con reacciones, hilos, adjuntos
- Usuarios — Miembros del workspace con info de perfil, email, estado
- Canales — Canales públicos y privados con tema, propósito, conteo de miembros
Para obtener un bot token:
- Vaya a api.slack.com/apps y cree una nueva app
- Agregue Bot Token Scopes:
channels:history,channels:read,users:read,users:read.email - Instale la app en su workspace y copie el Bot User OAuth Token
Arquitectura de Conectores
Todos los conectores siguen el mismo patrón de pipeline:
Fuente Externa → Motor del Conector → Procesamiento → Almacén de Datos Iara
- Conexión almacena credenciales encriptadas (tokens OAuth o contraseñas)
- Job define qué extraer (query, hoja de cálculo, carpeta) y la programación
- Motor de ejecución enruta al conector apropiado
- Los datos siempre se normalizan antes de importarlos a su almacén de datos
- La plataforma se encarga de la inferencia de schema, creación de tabla y carga de datos
Planes y Precios
| Plan | Conectores Incluidos |
|---|---|
| Starter | PostgreSQL, MySQL, SQL Server, Google Sheets, Microsoft Excel, Carga de Archivos, API de Entrada, Cliente de API con IA, MCP, Shopify, Stripe, MongoDB, FTP/SFTP |
| Growth | + HubSpot, TOTVS Protheus, S3/GCS, Salesforce, Notion, Slack |
| Business | + BigQuery, Snowflake, SAP, Kafka |