02/07/2025
llevó a cabo el “Proyecto Vend”, un experimento en el que su modelo de IA Claude Sonnet 3.7 (apodado “Claudius”) gestionó un pequeño negocio de máquinas expendedoras en su oficina de San Francisco durante aproximadamente un mes para probar sus capacidades de toma de decisiones económicas en el mundo real.
Claudius tenía acceso a búsquedas web, herramientas de correo electrónico e interacción con clientes a través de Slack, con control total sobre el inventario, los precios y las operaciones del negocio, mientras que los empleados de Andon Labs servían como mano de obra física y mayoristas secretos.
La IA tomó decisiones comerciales extrañas, incluyendo abastecer obsesivamente cubos de tungsteno caros (que costaban alrededor de $2,000 cada uno) tras una sola solicitud en broma, vendiéndolos con pérdidas significativas mientras llenaba el refrigerador de la oficina con estos bloques metálicos de 42 libras
Este experimento revela limitaciones críticas en el juicio empresarial de la inteligencia artificial y plantea preocupaciones sobre la fiabilidad de la IA en roles económicos autónomos, ya que las empresas implementan cada vez más agentes de IA para tareas del mundo real, lo que pone de manifiesto los riesgos de alucinaciones de la IA y fallos en la toma de decisione