La Newsletter de Startups' Oasis

Share this post

#81 Voicemod y el mundo de voice AI.

startupsoasis.substack.com

#81 Voicemod y el mundo de voice AI.

Isabel Kofoed
Mar 2
2
Share this post

#81 Voicemod y el mundo de voice AI.

startupsoasis.substack.com

Perdonad las 24 horas de retraso, el equipo de Startup’s Oasis estábamos en el 4YFN organizando The Sustainability Gathering. ¡Gracias a todos los que vinisteis!


Hot topic 🔥

Voicemod ha cerrado una ronda de inversión de $14,5M con la entrada de K Fund, Bitkraft Venture, quién lideró la anterior ronda y The Mini Fund, vehículo de inversión impulsado por Eros Resmini, uno de los cofundadores de Discord. 

Después de 10 años jugando con efectos de audio en el campo del procesamiento digital de señales (DSP), Voicemod se ha convertido en el creador líder en tecnología de cambio de voz y caja de resonancia en tiempo real.

La tecnología DSP consiste en aplicar efectos a la voz (real) de una persona, pero los avances en IA han permitido a startups como Voicemod ofrecer herramientas para crear voces (irreales) totalmente sintetizadas y permitir que los usuarios "lleven puestas" esas voces en tiempo real, de modo que puedan hablar con una voz que no es la suya. Algo así como los filtros de Instagram o TikTok en formato voz.

Después de haber adquirido Voctrolabs, lanzaron las primeras voces generadas con IA hace cinco meses, permitiendo cantar en tiempo real con la voz de otro cantante. Imagínate poder cantar Bohemian Rhapsody literalmente con la voz de Freddie Mercury. Ahora han firmado acuerdos con empresas como Warner para incorporar voces y sonidos de franquicias de películas o series famosas.


The opportunity 🐣

El mes pasado, después de ChatGPT y DALL-E, Microsoft anunció un nuevo modelo de inteligencia artificial de texto a voz llamado VALL-E, capaz de imitar la voz de cualquier persona cuando se alimenta con un audio de tres segundos. Una vez que aprende una voz concreta, VALL-E puede sintetizar el audio de esa persona diciendo cualquier cosa y hacerlo de forma que intente preservar el tono emocional del hablante e incluso el entorno acústico.

Los investigadores son conscientes del posible perjuicio social que podría acarrear esta tecnología, siendo la suplantación de la identificación de voz el principal riesgo, para lo que están construyendo modelos de detección para discriminar si un clip de audio ha sido sintetizado por VALL-E.

Cada vez más bancos utilizan el reconocimiento de voz para que los clientes puedan acceder a sus cuentas mediante autenticación por voz. Recientemente se ha conseguido entrar en una cuenta bancaria utilizando la tecnología de voice AI de ElevenLabs, lo que invita a pensar sobre las medidas extras de seguridad que será necesario desplegar.

Pero no todo son peligros. La inteligencia artificial aplicada a la voz tiene casos de usos muy interesantes en el sector de la sanidad. Los bots de voz se utilizaron para examinar a pacientes durante la pandemia, ya que era necesario minimizar el contacto en persona. Las empresas están apostando fuerte por este potencial. Tanto es así, que Microsoft ha adquirido la startup Nuance por 20.000 millones de dólares.

Es probable que los pacientes esperen obtener respuestas rápidas a consultas sobre sus síntomas, efectos adversos de los medicamentos, terapias disponibles, disponibilidad farmacéutica y recomendaciones terapéuticas con asistentes de voz sanitarios inteligentes como Alexa y Google Home. Además, los asistentes de voz tienen el poder de transformar la asistencia sanitaria ofreciendo datos actualizados sobre el estado de nuestra salud mental. A medida que cambia la salud de una persona, también lo hace su “acústica”. Estas cualidades auditivas pueden utilizarse para predecir estados emocionales, emociones, estrés, ansiedad, tristeza, memoria, conmociones cerebrales, enfermedades cardíacas y otras dolencias.


Two to tango 💃

Dos startups españolas que han sabido abordar esta mega tendencia enfocándola desde puntos de vista diferente.

Biometric Vox – Soluciones mediante la voz - Biometric Vox
  1. Fundación de Biometrix Vox: 2015 en Murcia.

  2. Fundadores: Joaquín Cros.

  3. Modelo: desarrollan aplicaciones para la identificación rápida y segura por voz con el objetivo de firmar documentos, realizar transacciones seguras, acuerdos legales, consentimientos informados... 

  4. Alcance: a día de hoy han hecho más de 1,5M autenticaciones y tienen 60K huellas vocales registradas

  5. Financiación: levantaron una ronda de financiación de €1M liderada por InnoCells, el hub de negocios digitales de Banco Sabadell.

    Aflorithmic Labs
  1. Fundación de Aflorithmic: 2019 en Londres y Barcelona.

  2. Fundadores: Björn Ühss, Timo P Kunz, Peadar Coyle.

  3. Modelo: han desarrollado una plataforma de audio-as-a-service, a través de una API para impulsar la próxima generación de creación de audio. Con ellos se puede crear dinámicamente un audio de sonido profesional y totalmente producido a partir de un texto en cuestión de minutos.

  4. Alcance: tienen más de 600 voces creadas por IA en más de 60 idiomas y tienen clientes tan diversos como Swisscom o ETH Zürich.

  5. Financiación: levantaron una ronda seed de €1M a través de una asociación con Crowd Media Holdings.


Últimas rondas de financiación 💰

👉🏻 Si eres un fundador de alguna startup, estás buscando financiación y quieres hablar con nosotros para aparecer en el Oasis, respóndenos a este correo.

En el Oasis recopilamos todas las rondas de financiación que se cierran cada semana. Por si no has tenido tiempo de echarle un ojo a las de las últimas 4 semanas, te las dejamos por aquí:

  • FEBRERO IV - Croquetas, iluminación, rehabilitación y más.

    • Hablamos de Star Robotics, Väcka, Nuwe, Improfit, Solo de Croquetas, Kumux, Uktena y VIVLA.

  • FEBRERO III - Contrataciones eficientes, embarazos, seguros y más.

    • Hablamos de Vitaance, Opscura, Innitius y Cultural Fit.

  • FEBRERO II - Servicios a domicilio, orientación vocacional, cargadores y más.

    • Hablamos de Build38, Bloobirds, Snab, Stemdo, Webel, Vega Chargers y Growth Road.

  • FEBRERO I - Ocio, carteras de inversión, oposiciones y más.

    • Hablamos de Fever, Twinco Capital, Mlean, Citec Solutions, Domma, CataTuPlaza y Lateua.


Convocatorias abiertas 📆

  • Primer evento de CreatorsLab de Qonto, donde los emprendedores podrán adquiriri las herramientas necesarias en los primeros pasos para lanzar. El siguiente es el 15 de marzo

  • 4YFN repite en Barcelona del 27 de febrero al 2 de marzo.

  • Zurich lanza la cuarta edición de su competición mundial Zurich Innovation Championship con la que crear el futuro de los seguros.

  • Stage2 busca diez startups industriales Industrial Tech en su segunda convocatoria.

Share this post

#81 Voicemod y el mundo de voice AI.

startupsoasis.substack.com
Comments
TopNewCommunity

No posts

Ready for more?

© 2023 Isa de Startups' Oasis
Privacy ∙ Terms ∙ Collection notice
Start WritingGet the app
Substack is the home for great writing