Saltar al contenido principal

Conectores

Los conectores definen cómo la plataforma se conecta a fuentes de datos externas. Cada tipo de conector tiene su propio método de autenticación, patrones de acceso a datos y funcionalidades.

Conectores Disponibles

PostgreSQL

El conector más maduro, con streaming completo, ingestión incremental y preview en tiempo real.

CaracterísticaEstado
AutenticaciónUsuario/Contraseña
Navegador de Schemas
Queries SQL Personalizadas
Preview (enriquecido por IA)
Ingestión Incremental✅ (basada en rastreo de cambios)
Ejecución Programada

Cómo funciona: La plataforma conecta a su base de datos PostgreSQL, ejecuta la query configurada (o extracción completa de la tabla), hace streaming de las filas como CSV y las importa a su almacén de datos.


Google Sheets

Conecte su cuenta Google vía OAuth para ingerir datos de hojas de cálculo de Google Sheets.

CaracterísticaEstado
AutenticaciónOAuth 2.0 (Google)
Preview
Ejecución Programada
Ingestión Incremental❌ (extracción completa)

Campos de configuración:

  • Spreadsheet ID — Encontrado en la URL de la hoja: docs.google.com/spreadsheets/d/SPREADSHEET_ID/edit
  • Range — ej: Sheet1!A:Z o solo A:Z para la hoja predeterminada

Cómo funciona: La plataforma usa la Google Sheets API v4 para leer los datos. La primera fila se trata como encabezado. Todas las filas siguientes se convierten a CSV y se envían al almacén de datos.


Microsoft (Excel / SharePoint)

Conecte su cuenta Microsoft 365 vía OAuth para acceder a archivos Excel Online, carpetas de SharePoint y listas de SharePoint.

CaracterísticaEstado
AutenticaciónOAuth 2.0 (Microsoft)
Preview
Ejecución Programada
Ingestión Incremental❌ (extracción completa)

Tres tipos de origen son soportados:

Archivo Excel

Lee un libro Excel específico de OneDrive o SharePoint.

Carpeta de SharePoint

Ingiere todos los archivos CSV y Excel de una carpeta de biblioteca de documentos de SharePoint.

Lista de SharePoint

Lee datos de una lista de SharePoint y los convierte a formato tabular.


MySQL (Parcial)

Configuración aceptada, pero la ejecución vía streaming SQL está pendiente de implementación.

SQL Server (Parcial)

Mismo estado que MySQL — la configuración de conexión funciona, ejecución pendiente.


API de Entrada (Push)

La plataforma actúa como servidor de API — sistemas externos envían datos a la plataforma a través de un endpoint webhook dedicado. Cada conexión recibe un token de ingestión único y revocable.

CaracterísticaEstado
AutenticaciónToken de Ingestión (generado automáticamente, 256-bit)
DirecciónPush (externo → plataforma)
Preview✅ (últimos datos recibidos)
Ejecución ProgramadaN/A — orientado a eventos

Cómo funciona: Cree una conexión API de Entrada, la plataforma genera una URL de endpoint única con token de ingestión. Los sistemas externos hacen POST de datos JSON al endpoint.


Cliente de API con IA (Pull)

Conéctese a cualquier REST API proporcionando su documentación y una descripción en lenguaje natural. La plataforma usa IA para generar automáticamente el código de integración.

CaracterísticaEstado
AutenticaciónBearer Token / API Key / Basic Auth / Header Personalizado
DirecciónPull (plataforma → externo)
Generación de Código con IA
Preview
Ejecución Programada
Revisión de Código✅ (usuario debe aprobar antes de programar)

MCP Server (Entrada)

La plataforma expone un endpoint de servidor MCP (Model Context Protocol). Agentes de IA externos pueden descubrir y llamar herramientas exportadas por la plataforma.

CaracterísticaEstado
AutenticaciónAPI Key (generada automáticamente)
DirecciónEntrada (agente externo → plataforma)
ProtocoloSSE (Server-Sent Events)

MCP Client (Salida)

Conéctese a servidores MCP externos para descubrir y llamar sus herramientas para extracción de datos.

CaracterísticaEstado
AutenticaciónBearer Token (opcional)
DirecciónSalida (plataforma → servidor MCP externo)
Descubrimiento de Herramientas✅ (auto-descubierto en conexión)
Preview
Ejecución Programada

Shopify

Ingiera datos de su tienda Shopify vía Admin API.

CaracterísticaEstado
AutenticaciónAdmin API Access Token
Objetos SoportadosPedidos, Productos, Clientes, Ítems de Inventario, Colecciones
Preview
Paginación✅ (basada en cursor vía header Link)
Ingestión Incremental✅ (vía rastreo updated_at)
Ejecución Programada
PlanStarter+

Campos de configuración:

  • Dominio de la Tienda — ej: mi-tienda.myshopify.com
  • Access Token — De una app personalizada Shopify (Admin API)
  • Versión de API — Por defecto 2024-01

Cómo funciona: La plataforma llama a la Shopify Admin REST API, pagina por todos los registros usando paginación basada en cursor (header Link), aplana objetos anidados y envía los datos como CSV al almacén de datos.

Para obtener un access token:

  1. Vaya a Admin Shopify → Configuración → Apps y canales de venta → Desarrollar apps
  2. Cree una app personalizada y configure los scopes del Admin API (read_orders, read_products, etc.)
  3. Instale la app y copie el Admin API access token

Stripe

Ingiera datos de pago y facturación de Stripe.

CaracterísticaEstado
AutenticaciónAPI Key Restringida (solo lectura)
Objetos SoportadosCargos, Suscripciones, Clientes, Facturas, Pagos, Disputas, Productos, Precios
Preview
Paginación✅ (basada en cursor vía starting_after)
Ingestión Incremental✅ (vía filtro de timestamp created)
Ejecución Programada
PlanStarter+

Campos de configuración:

  • API Key — Clave restringida con permisos de solo lectura

Cómo funciona: La plataforma llama a la Stripe REST API con paginación basada en cursor, aplana objetos anidados (metadata, dirección, etc.) y envía al almacén de datos.


HubSpot

Ingiera datos de CRM de HubSpot.

CaracterísticaEstado
AutenticaciónAccess Token de App Privada
Objetos SoportadosContactos, Empresas, Negocios, Tickets, Productos, Líneas de Pedido
Preview
Paginación✅ (API de búsqueda basada en cursor)
Ingestión Incremental✅ (vía updatedAt)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • Access Token — De una app privada HubSpot

Cómo funciona: La plataforma usa la HubSpot CRM v3 Search API para paginar por los registros. Las propiedades se aplanan automáticamente del objeto properties anidado.

Para obtener un access token:

  1. Vaya a HubSpot → Configuración → Integraciones → Apps Privadas
  2. Cree una app privada con scopes de lectura de objetos CRM
  3. Copie el access token

TOTVS Protheus

Ingiera datos del sistema ERP TOTVS Protheus vía REST API.

CaracterísticaEstado
AutenticaciónBasic Auth / Bearer Token / API Key
Entidades SoportadasClientes (SA1), Productos (SB1), Pedidos de Venta (SC5), Facturas (SF2), Financiero (SE1/SE2), personalizado
Preview
Paginación✅ (basada en offset)
Mapeo de Campos✅ (mapear campos Protheus a nombres estándar)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • URL Base — ej: https://protheus.empresa.com:8888
  • Tipo de Autenticación — Basic, Bearer o API Key
  • Ambiente / Empresa / Sucursal — Headers de contexto específicos de Protheus

Cómo funciona: La plataforma llama a la TOTVS Protheus REST API usando paginación por offset. Los endpoints de entidad preconfigurados (SA1, SB1, SC5, SF2, SE1, SE2) se mapean a objetos de negocio estándar. Se pueden especificar endpoints personalizados para entidades no estándar.


S3 / GCS (Bucket en la Nube)

Ingiera archivos de buckets Amazon S3 o Google Cloud Storage.

CaracterísticaEstado
AutenticaciónAccess Key (S3) / Service Account (GCS)
Formatos SoportadosCSV, JSON, JSONL
Preview
Ingestión Multi-Archivo
Compatible con S3✅ (MinIO, DigitalOcean Spaces, etc.)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • Proveedor — S3 o GCS
  • Nombre del Bucket — Bucket de destino
  • Región — Región S3 (ej: us-east-1)
  • Endpoint Personalizado — Para servicios compatibles con S3 como MinIO

Cómo funciona: La plataforma lista archivos en el bucket (filtrados por prefijo), descarga y analiza cada archivo, y luego envía los datos combinados al almacén de datos. Se agrega una columna _source_file para rastrear el origen de cada fila.


Salesforce

Ingiera datos de CRM y negocio de Salesforce usando queries SOQL.

CaracterísticaEstado
AutenticaciónOAuth Access Token
Queries SOQL Personalizadas
Objetos SoportadosTodos los objetos estándar y personalizados de Salesforce
Preview
Paginación✅ (automática vía nextRecordsUrl)
Ingestión Incremental✅ (vía LastModifiedDate)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • Instance URL — ej: https://miempresa.salesforce.com
  • Access Token — OAuth access token
  • Versión de API — Por defecto v59.0

Cómo funciona: La plataforma ejecuta queries SOQL contra la Salesforce REST API. Los resultados se paginan automáticamente usando nextRecordsUrl.


MongoDB

Ingiera documentos de MongoDB vía Atlas Data API.

CaracterísticaEstado
AutenticaciónAtlas Data API Key
Queries Personalizadas✅ (filter, projection, sort)
Preview
Ejecución Programada
PlanStarter+

Campos de configuración:

  • Data API URL — Endpoint Atlas Data API
  • API Key — Clave Data API
  • Data Source — Nombre del cluster (ej: Cluster0)
  • Database — Base de datos destino

Cómo funciona: La plataforma usa el endpoint /action/find del MongoDB Atlas Data API. Los tipos Extended JSON ($oid, $date, $numberDecimal) se convierten automáticamente a valores primitivos. Los arrays y objetos anidados se serializan como JSON en columnas string.


FTP / SFTP

Conéctese a servidores FTP o SFTP para ingerir archivos.

CaracterísticaEstado
AutenticaciónUsuario/Contraseña o Clave Privada (SFTP)
Prueba de Conexión✅ (alcanzabilidad TCP)
Ejecución Completa⚠️ Requiere dependencia ssh2-sftp-client
PlanStarter+

Nota: La ejecución completa de FTP/SFTP requiere los paquetes npm ssh2-sftp-client y basic-ftp instalados. La prueba de conexión solo verifica alcanzabilidad TCP.


BigQuery

Ejecute queries SQL en Google BigQuery e ingiera los resultados.

CaracterísticaEstado
AutenticaciónService Account JSON (JWT)
Queries SQL Personalizadas
Preview
Tipos de Schema✅ (preserva metadatos de tipo BigQuery)
Ejecución Programada
PlanBusiness+

Campos de configuración:

  • Project ID — ID del proyecto GCP
  • Service Account JSON — Clave de service account con rol BigQuery Reader
  • Location — Ubicación del dataset BigQuery (ej: US, EU)

Cómo funciona: La plataforma firma un JWT usando la clave del service account, lo intercambia por un access token, y luego ejecuta la query SQL vía BigQuery REST API. Los metadatos de schema se preservan.


Snowflake

Ejecute queries SQL en Snowflake e ingiera los resultados.

CaracterísticaEstado
AutenticaciónUsuario/Contraseña o Par de Claves
Queries SQL Personalizadas
Preview
Ejecución Programada
PlanBusiness+

Campos de configuración:

  • Account — Identificador de cuenta Snowflake (ej: xy12345.us-east-1)
  • Username / Password — Credenciales Snowflake
  • Warehouse — Warehouse de cómputo
  • Database / Schema / Role — Contexto predeterminado

Cómo funciona: La plataforma envía queries SQL vía Snowflake SQL REST API (/api/v2/statements). Los resultados se devuelven sincrónicamente para queries pequeñas. Los nombres y tipos de columnas se extraen del resultSetMetaData.


SAP (OData)

Ingiera datos de sistemas SAP vía servicios OData.

CaracterísticaEstado
AutenticaciónBasic Auth / OAuth / API Key
Queries OData✅ ($select, $filter, $expand)
Preview
Paginación✅ ($skip/$top con conteo inline)
Ejecución Programada
PlanBusiness+

Campos de configuración:

  • URL del Servicio OData — URL del servicio SAP Gateway
  • Tipo de Autenticación — Basic, OAuth o API Key
  • SAP Client — (opcional) Número de mandante (ej: 100)

Cómo funciona: La plataforma llama al servicio OData SAP con paginación $skip/$top, usando $inlinecount=allpages para determinar el conteo total de registros. Los objetos de metadatos (__metadata, __deferred) se eliminan automáticamente.


Kafka

Consuma mensajes de tópicos Kafka vía Confluent REST Proxy.

CaracterísticaEstado
AutenticaciónSASL (PLAIN / SCRAM)
ProtocoloConfluent REST Proxy (v2)
Preview
Control de Offset✅ (earliest / latest)
Ejecución Programada
PlanBusiness+

Campos de configuración:

  • URL del REST Proxy — Endpoint del Confluent REST Proxy
  • URL del Schema Registry — (opcional) Para deserialización Avro/Protobuf
  • Credenciales SASL — (opcional) Usuario/contraseña

Cómo funciona: La plataforma crea una instancia de consumidor vía REST Proxy, se suscribe al tópico especificado, consume mensajes y luego limpia el consumidor. Los valores de los mensajes se aplanan desde JSON; los metadatos (tópico, partición, offset, clave, timestamp) se preservan.


Notion

Ingiera datos de bases de datos y páginas de Notion.

CaracterísticaEstado
AutenticaciónToken de Integración
Objetos SoportadosBases de datos, Páginas
Preview
Paginación✅ (basada en cursor)
Ingestión Incremental✅ (vía last_edited_time)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • Token de Integración — De una integración Notion (secret_...)

Cómo funciona: La plataforma consulta bases de datos Notion usando el endpoint /databases/{id}/query de la API. Los 18+ tipos de propiedad de Notion (título, rich_text, número, select, multi_select, fecha, checkbox, URL, email, teléfono, fórmula, relación, rollup, personas, archivos, created_time, last_edited_time, status) se aplanan automáticamente a valores escalares.

Para obtener un token de integración:

  1. Vaya a notion.so/my-integrations
  2. Cree una nueva integración
  3. Comparta la base de datos destino con la integración

Slack

Exporte mensajes, usuarios y canales de espacios de trabajo Slack.

CaracterísticaEstado
AutenticaciónBot User OAuth Token (xoxb-...)
Tipos de DatosMensajes, Usuarios, Canales
Preview
Paginación✅ (basada en cursor)
Ingestión Incremental✅ (vía timestamp ts del mensaje)
Ejecución Programada
PlanGrowth+

Campos de configuración:

  • Bot Token — Slack Bot User OAuth Token (xoxb-...)

Tipos de datos:

  • Mensajes — Historial de mensajes del canal con reacciones, hilos, adjuntos
  • Usuarios — Miembros del workspace con info de perfil, email, estado
  • Canales — Canales públicos y privados con tema, propósito, conteo de miembros

Para obtener un bot token:

  1. Vaya a api.slack.com/apps y cree una nueva app
  2. Agregue Bot Token Scopes: channels:history, channels:read, users:read, users:read.email
  3. Instale la app en su workspace y copie el Bot User OAuth Token

Arquitectura de Conectores

Todos los conectores siguen el mismo patrón de pipeline:

Fuente Externa → Motor del Conector → Procesamiento → Almacén de Datos Iara
  1. Conexión almacena credenciales encriptadas (tokens OAuth o contraseñas)
  2. Job define qué extraer (query, hoja de cálculo, carpeta) y la programación
  3. Motor de ejecución enruta al conector apropiado
  4. Los datos siempre se normalizan antes de importarlos a su almacén de datos
  5. La plataforma se encarga de la inferencia de schema, creación de tabla y carga de datos

Planes y Precios

PlanConectores Incluidos
StarterPostgreSQL, MySQL, SQL Server, Google Sheets, Microsoft Excel, Carga de Archivos, API de Entrada, Cliente de API con IA, MCP, Shopify, Stripe, MongoDB, FTP/SFTP
Growth+ HubSpot, TOTVS Protheus, S3/GCS, Salesforce, Notion, Slack
Business+ BigQuery, Snowflake, SAP, Kafka