Conectores

Los conectores definen cómo la plataforma se conecta a fuentes de datos externas. Cada tipo de conector tiene su propio método de autenticación, patrones de acceso a datos y funcionalidades.

Conectores Disponibles

PostgreSQL

El conector más maduro, con streaming completo, ingestión incremental y preview en tiempo real.

Característica	Estado
Autenticación	Usuario/Contraseña
Navegador de Schemas	✅
Queries SQL Personalizadas	✅
Preview (enriquecido por IA)	✅
Ingestión Incremental	✅ (basada en rastreo de cambios)
Ejecución Programada	✅

Cómo funciona: La plataforma conecta a su base de datos PostgreSQL, ejecuta la query configurada (o extracción completa de la tabla), hace streaming de las filas como CSV y las importa a su almacén de datos.

Google Sheets

Conecte su cuenta Google vía OAuth para ingerir datos de hojas de cálculo de Google Sheets.

Característica	Estado
Autenticación	OAuth 2.0 (Google)
Preview	✅
Ejecución Programada	✅
Ingestión Incremental	❌ (extracción completa)

Campos de configuración:

Spreadsheet ID — Encontrado en la URL de la hoja: docs.google.com/spreadsheets/d/SPREADSHEET_ID/edit
Range — ej: Sheet1!A:Z o solo A:Z para la hoja predeterminada

Cómo funciona: La plataforma usa la Google Sheets API v4 para leer los datos. La primera fila se trata como encabezado. Todas las filas siguientes se convierten a CSV y se envían al almacén de datos.

Microsoft (Excel / SharePoint)

Conecte su cuenta Microsoft 365 vía OAuth para acceder a archivos Excel Online, carpetas de SharePoint y listas de SharePoint.

Característica	Estado
Autenticación	OAuth 2.0 (Microsoft)
Preview	✅
Ejecución Programada	✅
Ingestión Incremental	❌ (extracción completa)

Tres tipos de origen son soportados:

Archivo Excel

Lee un libro Excel específico de OneDrive o SharePoint.

Carpeta de SharePoint

Ingiere todos los archivos CSV y Excel de una carpeta de biblioteca de documentos de SharePoint.

Lista de SharePoint

Lee datos de una lista de SharePoint y los convierte a formato tabular.

MySQL (Parcial)

Configuración aceptada, pero la ejecución vía streaming SQL está pendiente de implementación.

SQL Server (Parcial)

Mismo estado que MySQL — la configuración de conexión funciona, ejecución pendiente.

API de Entrada (Push)

La plataforma actúa como servidor de API — sistemas externos envían datos a la plataforma a través de un endpoint webhook dedicado. Cada conexión recibe un token de ingestión único y revocable.

Característica	Estado
Autenticación	Token de Ingestión (generado automáticamente, 256-bit)
Dirección	Push (externo → plataforma)
Preview	✅ (últimos datos recibidos)
Ejecución Programada	N/A — orientado a eventos

Cómo funciona: Cree una conexión API de Entrada, la plataforma genera una URL de endpoint única con token de ingestión. Los sistemas externos hacen POST de datos JSON al endpoint.

Cliente de API con IA (Pull)

Conéctese a cualquier REST API proporcionando su documentación y una descripción en lenguaje natural. La plataforma usa IA para generar automáticamente el código de integración.

Característica	Estado
Autenticación	Bearer Token / API Key / Basic Auth / Header Personalizado
Dirección	Pull (plataforma → externo)
Generación de Código con IA	✅
Preview	✅
Ejecución Programada	✅
Revisión de Código	✅ (usuario debe aprobar antes de programar)

MCP Server (Entrada)

La plataforma expone un endpoint de servidor MCP (Model Context Protocol). Agentes de IA externos pueden descubrir y llamar herramientas exportadas por la plataforma.

Característica	Estado
Autenticación	API Key (generada automáticamente)
Dirección	Entrada (agente externo → plataforma)
Protocolo	SSE (Server-Sent Events)

MCP Client (Salida)

Conéctese a servidores MCP externos para descubrir y llamar sus herramientas para extracción de datos.

Característica	Estado
Autenticación	Bearer Token (opcional)
Dirección	Salida (plataforma → servidor MCP externo)
Descubrimiento de Herramientas	✅ (auto-descubierto en conexión)
Preview	✅
Ejecución Programada	✅

Shopify

Ingiera datos de su tienda Shopify vía Admin API.

Característica	Estado
Autenticación	Admin API Access Token
Objetos Soportados	Pedidos, Productos, Clientes, Ítems de Inventario, Colecciones
Preview	✅
Paginación	✅ (basada en cursor vía header Link)
Ingestión Incremental	✅ (vía rastreo `updated_at`)
Ejecución Programada	✅
Plan	Starter+

Campos de configuración:

Dominio de la Tienda — ej: mi-tienda.myshopify.com
Access Token — De una app personalizada Shopify (Admin API)
Versión de API — Por defecto 2024-01

Cómo funciona: La plataforma llama a la Shopify Admin REST API, pagina por todos los registros usando paginación basada en cursor (header Link), aplana objetos anidados y envía los datos como CSV al almacén de datos.

Para obtener un access token:

Vaya a Admin Shopify → Configuración → Apps y canales de venta → Desarrollar apps
Cree una app personalizada y configure los scopes del Admin API (read_orders, read_products, etc.)
Instale la app y copie el Admin API access token

Stripe

Ingiera datos de pago y facturación de Stripe.

Característica	Estado
Autenticación	API Key Restringida (solo lectura)
Objetos Soportados	Cargos, Suscripciones, Clientes, Facturas, Pagos, Disputas, Productos, Precios
Preview	✅
Paginación	✅ (basada en cursor vía `starting_after`)
Ingestión Incremental	✅ (vía filtro de timestamp `created`)
Ejecución Programada	✅
Plan	Starter+

Campos de configuración:

API Key — Clave restringida con permisos de solo lectura

Cómo funciona: La plataforma llama a la Stripe REST API con paginación basada en cursor, aplana objetos anidados (metadata, dirección, etc.) y envía al almacén de datos.

HubSpot

Ingiera datos de CRM de HubSpot.

Característica	Estado
Autenticación	Access Token de App Privada
Objetos Soportados	Contactos, Empresas, Negocios, Tickets, Productos, Líneas de Pedido
Preview	✅
Paginación	✅ (API de búsqueda basada en cursor)
Ingestión Incremental	✅ (vía `updatedAt`)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

Access Token — De una app privada HubSpot

Cómo funciona: La plataforma usa la HubSpot CRM v3 Search API para paginar por los registros. Las propiedades se aplanan automáticamente del objeto properties anidado.

Para obtener un access token:

Vaya a HubSpot → Configuración → Integraciones → Apps Privadas
Cree una app privada con scopes de lectura de objetos CRM
Copie el access token

TOTVS Protheus

Ingiera datos del sistema ERP TOTVS Protheus vía REST API.

Característica	Estado
Autenticación	Basic Auth / Bearer Token / API Key
Entidades Soportadas	Clientes (SA1), Productos (SB1), Pedidos de Venta (SC5), Facturas (SF2), Financiero (SE1/SE2), personalizado
Preview	✅
Paginación	✅ (basada en offset)
Mapeo de Campos	✅ (mapear campos Protheus a nombres estándar)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

URL Base — ej: https://protheus.empresa.com:8888
Tipo de Autenticación — Basic, Bearer o API Key
Ambiente / Empresa / Sucursal — Headers de contexto específicos de Protheus

Cómo funciona: La plataforma llama a la TOTVS Protheus REST API usando paginación por offset. Los endpoints de entidad preconfigurados (SA1, SB1, SC5, SF2, SE1, SE2) se mapean a objetos de negocio estándar. Se pueden especificar endpoints personalizados para entidades no estándar.

S3 / GCS (Bucket en la Nube)

Ingiera archivos de buckets Amazon S3 o Google Cloud Storage.

Característica	Estado
Autenticación	Access Key (S3) / Service Account (GCS)
Formatos Soportados	CSV, JSON, JSONL
Preview	✅
Ingestión Multi-Archivo	✅
Compatible con S3	✅ (MinIO, DigitalOcean Spaces, etc.)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

Proveedor — S3 o GCS
Nombre del Bucket — Bucket de destino
Región — Región S3 (ej: us-east-1)
Endpoint Personalizado — Para servicios compatibles con S3 como MinIO

Cómo funciona: La plataforma lista archivos en el bucket (filtrados por prefijo), descarga y analiza cada archivo, y luego envía los datos combinados al almacén de datos. Se agrega una columna _source_file para rastrear el origen de cada fila.

Salesforce

Ingiera datos de CRM y negocio de Salesforce usando queries SOQL.

Característica	Estado
Autenticación	OAuth Access Token
Queries SOQL Personalizadas	✅
Objetos Soportados	Todos los objetos estándar y personalizados de Salesforce
Preview	✅
Paginación	✅ (automática vía `nextRecordsUrl`)
Ingestión Incremental	✅ (vía `LastModifiedDate`)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

Instance URL — ej: https://miempresa.salesforce.com
Access Token — OAuth access token
Versión de API — Por defecto v59.0

Cómo funciona: La plataforma ejecuta queries SOQL contra la Salesforce REST API. Los resultados se paginan automáticamente usando nextRecordsUrl.

MongoDB

Ingiera documentos de MongoDB vía Atlas Data API.

Característica	Estado
Autenticación	Atlas Data API Key
Queries Personalizadas	✅ (filter, projection, sort)
Preview	✅
Ejecución Programada	✅
Plan	Starter+

Campos de configuración:

Data API URL — Endpoint Atlas Data API
API Key — Clave Data API
Data Source — Nombre del cluster (ej: Cluster0)
Database — Base de datos destino

Cómo funciona: La plataforma usa el endpoint /action/find del MongoDB Atlas Data API. Los tipos Extended JSON ($oid, $date, $numberDecimal) se convierten automáticamente a valores primitivos. Los arrays y objetos anidados se serializan como JSON en columnas string.

FTP / SFTP

Conéctese a servidores FTP o SFTP para ingerir archivos.

Característica	Estado
Autenticación	Usuario/Contraseña o Clave Privada (SFTP)
Prueba de Conexión	✅ (alcanzabilidad TCP)
Ejecución Completa	⚠️ Requiere dependencia `ssh2-sftp-client`
Plan	Starter+

Nota: La ejecución completa de FTP/SFTP requiere los paquetes npm ssh2-sftp-client y basic-ftp instalados. La prueba de conexión solo verifica alcanzabilidad TCP.

BigQuery

Ejecute queries SQL en Google BigQuery e ingiera los resultados.

Característica	Estado
Autenticación	Service Account JSON (JWT)
Queries SQL Personalizadas	✅
Preview	✅
Tipos de Schema	✅ (preserva metadatos de tipo BigQuery)
Ejecución Programada	✅
Plan	Business+

Campos de configuración:

Project ID — ID del proyecto GCP
Service Account JSON — Clave de service account con rol BigQuery Reader
Location — Ubicación del dataset BigQuery (ej: US, EU)

Cómo funciona: La plataforma firma un JWT usando la clave del service account, lo intercambia por un access token, y luego ejecuta la query SQL vía BigQuery REST API. Los metadatos de schema se preservan.

Snowflake

Ejecute queries SQL en Snowflake e ingiera los resultados.

Característica	Estado
Autenticación	Usuario/Contraseña o Par de Claves
Queries SQL Personalizadas	✅
Preview	✅
Ejecución Programada	✅
Plan	Business+

Campos de configuración:

Account — Identificador de cuenta Snowflake (ej: xy12345.us-east-1)
Username / Password — Credenciales Snowflake
Warehouse — Warehouse de cómputo
Database / Schema / Role — Contexto predeterminado

Cómo funciona: La plataforma envía queries SQL vía Snowflake SQL REST API (/api/v2/statements). Los resultados se devuelven sincrónicamente para queries pequeñas. Los nombres y tipos de columnas se extraen del resultSetMetaData.

SAP (OData)

Ingiera datos de sistemas SAP vía servicios OData.

Característica	Estado
Autenticación	Basic Auth / OAuth / API Key
Queries OData	✅ ($select, $filter, $expand)
Preview	✅
Paginación	✅ ($skip/$top con conteo inline)
Ejecución Programada	✅
Plan	Business+

Campos de configuración:

URL del Servicio OData — URL del servicio SAP Gateway
Tipo de Autenticación — Basic, OAuth o API Key
SAP Client — (opcional) Número de mandante (ej: 100)

Cómo funciona: La plataforma llama al servicio OData SAP con paginación $skip/$top, usando $inlinecount=allpages para determinar el conteo total de registros. Los objetos de metadatos (__metadata, __deferred) se eliminan automáticamente.

Kafka

Consuma mensajes de tópicos Kafka vía Confluent REST Proxy.

Característica	Estado
Autenticación	SASL (PLAIN / SCRAM)
Protocolo	Confluent REST Proxy (v2)
Preview	✅
Control de Offset	✅ (earliest / latest)
Ejecución Programada	✅
Plan	Business+

Campos de configuración:

URL del REST Proxy — Endpoint del Confluent REST Proxy
URL del Schema Registry — (opcional) Para deserialización Avro/Protobuf
Credenciales SASL — (opcional) Usuario/contraseña

Cómo funciona: La plataforma crea una instancia de consumidor vía REST Proxy, se suscribe al tópico especificado, consume mensajes y luego limpia el consumidor. Los valores de los mensajes se aplanan desde JSON; los metadatos (tópico, partición, offset, clave, timestamp) se preservan.

Notion

Ingiera datos de bases de datos y páginas de Notion.

Característica	Estado
Autenticación	Token de Integración
Objetos Soportados	Bases de datos, Páginas
Preview	✅
Paginación	✅ (basada en cursor)
Ingestión Incremental	✅ (vía `last_edited_time`)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

Token de Integración — De una integración Notion (secret_...)

Cómo funciona: La plataforma consulta bases de datos Notion usando el endpoint /databases/{id}/query de la API. Los 18+ tipos de propiedad de Notion (título, rich_text, número, select, multi_select, fecha, checkbox, URL, email, teléfono, fórmula, relación, rollup, personas, archivos, created_time, last_edited_time, status) se aplanan automáticamente a valores escalares.

Para obtener un token de integración:

Vaya a notion.so/my-integrations
Cree una nueva integración
Comparta la base de datos destino con la integración

Slack

Exporte mensajes, usuarios y canales de espacios de trabajo Slack.

Característica	Estado
Autenticación	Bot User OAuth Token (`xoxb-...`)
Tipos de Datos	Mensajes, Usuarios, Canales
Preview	✅
Paginación	✅ (basada en cursor)
Ingestión Incremental	✅ (vía timestamp `ts` del mensaje)
Ejecución Programada	✅
Plan	Growth+

Campos de configuración:

Bot Token — Slack Bot User OAuth Token (xoxb-...)

Tipos de datos:

Mensajes — Historial de mensajes del canal con reacciones, hilos, adjuntos
Usuarios — Miembros del workspace con info de perfil, email, estado
Canales — Canales públicos y privados con tema, propósito, conteo de miembros

Para obtener un bot token:

Vaya a api.slack.com/apps y cree una nueva app
Agregue Bot Token Scopes: channels:history, channels:read, users:read, users:read.email
Instale la app en su workspace y copie el Bot User OAuth Token

Arquitectura de Conectores

Todos los conectores siguen el mismo patrón de pipeline:

Fuente Externa → Motor del Conector → Procesamiento → Almacén de Datos Iara

Conexión almacena credenciales encriptadas (tokens OAuth o contraseñas)
Job define qué extraer (query, hoja de cálculo, carpeta) y la programación
Motor de ejecución enruta al conector apropiado
Los datos siempre se normalizan antes de importarlos a su almacén de datos
La plataforma se encarga de la inferencia de schema, creación de tabla y carga de datos

Planes y Precios

Plan	Conectores Incluidos
Starter	PostgreSQL, MySQL, SQL Server, Google Sheets, Microsoft Excel, Carga de Archivos, API de Entrada, Cliente de API con IA, MCP, Shopify, Stripe, MongoDB, FTP/SFTP
Growth	+ HubSpot, TOTVS Protheus, S3/GCS, Salesforce, Notion, Slack
Business	+ BigQuery, Snowflake, SAP, Kafka

Conectores Disponibles​

PostgreSQL​

Google Sheets​

Microsoft (Excel / SharePoint)​

Archivo Excel​

Carpeta de SharePoint​

Lista de SharePoint​

MySQL (Parcial)​

SQL Server (Parcial)​

API de Entrada (Push)​

Cliente de API con IA (Pull)​

MCP Server (Entrada)​

MCP Client (Salida)​

Shopify​

Stripe​

HubSpot​

TOTVS Protheus​

S3 / GCS (Bucket en la Nube)​

Salesforce​

MongoDB​

FTP / SFTP​

BigQuery​

Snowflake​

SAP (OData)​

Kafka​

Notion​

Slack​

Arquitectura de Conectores​

Planes y Precios​

Conectores Disponibles

PostgreSQL

Google Sheets

Microsoft (Excel / SharePoint)

Archivo Excel

Carpeta de SharePoint

Lista de SharePoint

MySQL (Parcial)

SQL Server (Parcial)

API de Entrada (Push)

Cliente de API con IA (Pull)

MCP Server (Entrada)

MCP Client (Salida)

Shopify

Stripe

HubSpot

TOTVS Protheus

S3 / GCS (Bucket en la Nube)

Salesforce

MongoDB

FTP / SFTP

BigQuery

Snowflake

SAP (OData)

Kafka

Notion

Slack

Arquitectura de Conectores

Planes y Precios