Betaworks apuesta por agentes de IA en la última cohorte ‘Camp’

Betaworks está adoptando la tendencia de la IA no con otro LLM, sino con un conjunto de modelos de tipo agente que automatizan tareas cotidianas que, sin embargo, no son tan simples de definir. La última incubadora “Camp” del inversor capacitó y financió 9 nuevas empresas de agentes de IA que esperan que asuman las tareas más tediosas de hoy.

Los casos de uso de muchas de estas empresas parecen prometedores, pero la IA tiende a tener problemas para cumplir sus promesas. ¿Confiarías en una nueva y brillante IA para ordenar tu correo electrónico por ti? ¿Qué pasa con la extracción y estructuración de información de una página web? ¿A alguien le importaría que una IA programe reuniones en cualquier lugar donde funcione?

Hay un elemento de confianza que aún no se ha establecido con estos servicios, algo que ocurre con la mayoría de las tecnologías que cambian la forma en que actuamos. Pedir direcciones a MapQuest parecía extraño hasta que dejó de ser así, y ahora la navegación GPS es una herramienta cotidiana. ¿Pero se encuentran los agentes de IA en esa etapa? John Borthwick, director ejecutivo y fundador de Betaworks, así lo cree. (Divulgación: el ex editor de TechCrunch y presentador de Disrupt, Jordan Crook, dejó TC para trabajar en la empresa).

“Estás entrando en algo en lo que hemos pasado mucho tiempo pensando”, dijo a TechCrunch. “Aunque la IA agente está en sus inicios (y hay problemas en torno a las tasas de éxito de los agentes, etc.), estamos viendo avances tremendos incluso desde que comenzó Camp”.

Si bien la tecnología seguirá mejorando, Borthwick explicó que algunos clientes están dispuestos a adoptarla en su estado actual.

“Históricamente, hemos visto a los clientes dar un acto de fe, incluso en tareas de mayor riesgo, si un producto era ‘suficientemente bueno’. El Bill.com original, a pesar de hacer cosas interesantes con OCR y scraping de correo electrónico, no siempre lo hacía bien, y los usuarios aún confiaban en él transacciones por valor de miles de dólares porque hacía que una tarea terrible fuera menos terrible. Y con el tiempo, a través de un diseño de interfaz altamente comunicativo, los circuitos de retroalimentación de esos clientes crearon un producto aún mejor y más confiable”, afirmó.

“Por ahora, la mayoría de los primeros usuarios de los productos en Camp son desarrolladores, fundadores y primeros usuarios de tecnología, y ese grupo siempre ha estado dispuesto a probar pacientemente y brindar comentarios sobre estos productos, que eventualmente saltan a la corriente principal”.

Betaworks Camp es un acelerador de tres meses en el que empresas seleccionadas en el tema elegido reciben ayuda práctica con su producto, estrategia y conexiones antes de ser expulsadas con un cheque de $ 500 mil, cortesía de Betaworks, Mozilla Ventures, Differential. Ventures y Stem AI. Pero no antes de que las nuevas empresas se pavoneen el día de la demostración, el 7 de mayo.

Aunque ya hemos echado un vistazo a la alineación de antemano. Aquí están los tres que más me llamaron la atención.

Twin automatiza tareas utilizando un “modelo de acción” del que hemos oído hablar a Rabbit durante algunos meses (pero que aún no se ha enviado). Al entrenar un modelo con una gran cantidad de datos que representan interfaces de software, puede (afirman estas empresas) aprender cómo completar tareas comunes, cosas que son más complejas de lo que una API puede manejar, pero no tanto como para no poder delegarlas a un “pasante inteligente”. De hecho, los escribimos en enero.

Entonces, en lugar de pedirle a un ingeniero de backend que cree un script personalizado para realizar una determinada tarea, puede demostrarlo o describirlo en un lenguaje común. Cosas como “poner todos los currículums que recibimos hoy en una carpeta en Dropbox y cambiarles el nombre del solicitante, luego enviarme un mensaje privado con el enlace para compartir en Slack”. Y una vez que haya modificado ese flujo de trabajo (“Ups, esta vez agregue la fecha de la solicitud a los nombres de los archivos”), puede ser simplemente la nueva forma en que funciona el proceso. Automatizar el 20% de las tareas que ocupan el 80% de nuestro tiempo es el objetivo de la empresa; si podrá hacerlo de manera asequible es probablemente la verdadera pregunta. (Twin se negó a dar más detalles sobre la naturaleza de su modelo y proceso de capacitación).

Esquí tiene como objetivo mejorar el proceso ocasionalmente doloroso de encontrar un horario de reunión que funcione para dos (o tres, o cuatro…) personas. Simplemente envía una copia al bot en un correo electrónico o en un hilo de Slack y comenzará el proceso de conciliar la disponibilidad y las preferencias de todos. Si tiene acceso a horarios, los verificará; si alguien dice que preferiría la tarde si es jueves, funciona con eso; se puede decir que algunas personas tienen prioridad; etcétera. Cualquiera que trabaje con un asistente ejecutivo capacitado sabe que es insustituible, pero es probable que todos los EA prefieran dedicar menos tiempo a tareas que son solo un montón de “¿Qué tal esto? ¿No? ¿Qué tal esto?”

Créditos de imagen: Esquí

Como misántropo, no tengo este problema de programación, pero aprecio que otros sí lo tengan, y también preferiría una solución del tipo “configúrelo y olvídese” en la que simplemente acepten los resultados. Y está dentro de las capacidades de los agentes de IA actuales, cuya tarea principal sería comprender el lenguaje natural en lugar de las formas.

Jsonify es una evolución de los raspadores de sitios web que pueden extraer datos de contextos relativamente no estructurados. Esto se ha hecho durante años, pero el motor que extrae la información nunca ha sido tan inteligente. Si se trata de un documento grande y plano, funcionan bien; si está en pestañas del sitio o en una lista visual mal codificada destinada a que los humanos hagan clic, pueden fallar. Jsonify utiliza la comprensión mejorada de los modelos visuales de IA actuales para analizar y ordenar mejor los datos que pueden ser inaccesibles para rastreadores simples.

Créditos de imagen: Jsonify

Entonces, podrías hacer una búsqueda de opciones de Airbnb en un área determinada y luego hacer que Jsonify las coloque todas en una lista estructurada con columnas de precio, distancia desde el aeropuerto, calificación, tarifas ocultas, etc. Luego podrías hacer lo mismo en Vacasa. y extraer los mismos datos, tal vez para los mismos lugares (hice esto y ahorré como $150 el otro día, pero desearía haber automatizado el proceso). O, ya sabes, hacer cosas profesionales.

¿Pero la imprecisión inherente a los LLM no los convierte en una herramienta cuestionable para el trabajo? “Hemos logrado construir un sistema de control cruzado y una barandilla bastante sólida”, dijo el fundador Ananth Manivannan. “Utilizamos algunos modelos diferentes en tiempo de ejecución para comprender la página, lo que proporciona cierta validación, y los LLM que utilizamos están ajustados a nuestro caso de uso, por lo que generalmente son bastante confiables incluso sin la capa de barrera. Por lo general, vemos una precisión de extracción superior al 95%, según el caso de uso”.

Podría ver que cualquiera de estos sería útil probablemente en cualquier negocio tecnológico. Los demás miembros de la cohorte son un poco más técnicos o situacionales; aquí están los 6 restantes:

  • IA resuelta – automatización agente de flujos de trabajo en la nube. Se siente útil hasta que las integraciones personalizadas lo alcanzan.
  • inundación – un controlador de bandeja de entrada de IA que lee su correo electrónico y encuentra lo importante mientras prepara las respuestas y acciones adecuadas.
  • IA ampliable – ¿Tu IA está retrocediendo? Pregúntele a su médico si Extensible es la infraestructura de prueba y registro adecuada para su implementación.
  • Adversario – un personaje virtual diseñado para que los niños tengan amplias interacciones y jueguen con él. Se siente como un campo minado desde el punto de vista ético y legal, pero alguien tiene que atravesarlo.
  • Investigación de alta dimensión – el juego de infraestructura. Un marco para agentes de IA basados ​​en la web con un modelo de pago por uso, de modo que si el experimento de su empresa fracasa, solo deberá unos pocos dólares.
  • Cuerpo – IA generativa para robótica, un campo donde los datos de entrenamiento son comparativamente escasos. Pensé que era una palabra africana pero es simplemente “encarnar”.

No hay duda de que los agentes de IA desempeñarán algún papel en los flujos de trabajo de software cada vez más automatizados del futuro cercano, pero la naturaleza y el alcance de ese papel aún no están escritos. Claramente, Betaworks pretende poner un pie en la puerta temprano, incluso si algunos de los productos aún no están listos para su debut en el mercado masivo.

Podrás ver a las empresas mostrar sus productos agentes el 7 de mayo.

Fuente