Detectar lo indetectable: herramientas de IA para identificar contenido generado por IA
En apenas unos años, la IA Generativa ha pasado de ser una curiosidad tecnológica a algo que usamos a diario. Desde asistentes que redactan correos electrónicos hasta chatbots que mantienen conversaciones que parecen humanas. La IA ha cambiado radicalmente la forma de trabajar, de escribir y de pensar de las personas: lo que antes nos llevaba horas ahora se puede hacer en segundos con un prompt bien definido. Esta democratización en la creación de contenido ha abierto posibilidades infinitas.
Pero como sucede con toda revolución tecnológica, no todo es positivo. La misma facilidad que hace de la IA una herramienta tan potente también genera un problema. ¿Cómo se puede distinguir entre un texto generado por un humano y uno generado por una IA?
Cómo funcionan los detectores de contenido generado por IA
Esta pregunta tiene consecuencias importantes en la práctica, ya que, cuando la autenticidad del contenido importa (como por ejemplo cuando tenemos que verificar la autoría de un trabajo en educación), es fundamental garantizar que las propuestas sean originales, por lo que necesitamos herramientas fiables. Y aquí es donde entran en juego los detectores de contenido generado por IA.
Herramientas que, curiosamente, usan la propia IA para detectar su presencia. Pero ¿cómo funcionan exactamente?
Los detectores de texto generado por IA se basan en algo aparentemente contradictorio: usar IA para identificar contenido creado por otras IA. Aunque suene paradójico, los modelos de lenguaje dejan "huellas digitales" características en sus textos, patrones que se pueden reconocer y analizar.
Los detectores de contenido generado por IA emplean la propia inteligencia artificial para desenmascarar lo que otras IA han creado.
Perplejidad y variabilidad: las claves para detectar texto de IA
Para entender cómo funcionan, hay que explicar dos conceptos importantes:
- El primero es la perplejidad, que se encarga de medir lo predecible que es un texto. La IA tiende a elegir palabras probables, generando textos predecibles con baja perplejidad. Las personas en cambio somos más impredecibles: usamos giros inesperados o palabras menos obvias, y por eso nuestros textos tienen mayor perplejidad.
- El segundo concepto es el burstiness o variabilidad: las personas, al escribir, alternamos entre frases cortas y largas y entre frases simples y complejas, mientras que la IA mantiene un ritmo bastante uniforme.
La IA genera textos predecibles con baja perplejidad, mientras que las personas escribimos de forma más variada e impredecible.
En cuanto a la tecnología, estos detectores usan modelos basados en transformers, la misma tecnología que impulsa sistemas como GPT o Claude. Los más comunes son versiones adaptadas de BERT, RoBERTa o DistilBERT, entrenados con millones de ejemplos de texto humano y generado por IA. También analizan los embeddings (representaciones matemáticas del texto), porque los textos humanos y los de IA tienden a agruparse en zonas diferentes del espacio vectorial.
Además, se usan técnicas estadísticas complementarias: análisis de patrones de repetición, medición de la diversidad de vocabulario (los humanos usamos más variedad), y análisis de complejidad sintáctica. También existe el watermarking o marcas de agua digitales, patrones imperceptibles que algunas IA incorporan en sus textos, aunque esto solo funciona si el texto no ha sido editado después.
¿Son realmente fiables los detectores de texto de IA?
Ninguna de estas técnicas es perfecta. Estamos en una especie de "carrera tecnológica": a medida que los modelos generativos mejoran y suenan más humanos, también se vuelven más difíciles de detectar. Los textos híbridos (editados parcialmente por humanos) complican mucho las cosas. Y encima están los falsos positivos (escritores humanos con estilos muy estructurados que parecen IA) y los falsos negativos (textos de IA que pasan desapercibidos).
La realidad es que estas herramientas funcionan aceptablemente en muchos casos, pero tienen límites claros. Van mejor con textos largos que con cortos, y funcionan mejor con contenido general que con textos muy especializados. Además, necesitan actualizaciones constantes para seguir el ritmo de los nuevos modelos generativos que van apareciendo.
Incluso las mejores herramientas de detección de texto de IA están lejos de ser infalibles.
De hecho, los números lo confirman. El estudio Testing of detection tools for AI-generated text evaluó recientemente la precisión de las principales herramientas disponibles y los resultados son reveladores: TurnItIn y Compilatio alcanzan tasas cercanas al 80% de precisión, siendo las más fiables.
¿Son fiables los detectores de textos generados por IA? Fuente: Testing of detection tools for AI-generated text.
Otras herramientas como Content at Scale o PlagiarismCheck apenas llegan al 50% (equivalente a lanzar una moneda al aire), mientras que otras más populares como GPTZero o ZeroGPT se quedan entre el 65-70%. Con esto se demuestra que incluso las mejores opciones están lejos de ser infalibles.
¿Cuándo sí pueden ser útiles estos detectores?
A pesar de sus limitaciones, estas herramientas tienen sentido en varios sectores. En el ámbito educativo, muchas instituciones las integran en sus procesos de evaluación académica. En periodismo y medios digitales, se usan para gestionar la producción de contenido a gran escala. En recursos humanos, forman parte de los procesos de selección cuando se analizan grandes volúmenes de candidaturas.
También están ganando relevancia en sectores donde la originalidad es especialmente crítica. En el audiovisual, las convocatorias de ayudas públicas para guiones cinematográficos empiezan a incorporarlas en sus fases de evaluación.
En general, tienen sentido allí donde se necesita analizar grandes cantidades de texto y la autenticidad del contenido es importante, siempre que se combinen con criterio humano.
Conclusión
La detección de contenido generado por IA no es una ciencia exacta. Es un campo en constante evolución que debe complementarse siempre con criterio humano y análisis contextual. No podemos confiar ciegamente en un porcentaje que nos da una herramienta.
Y ahora viene la pregunta inevitable: ¿este artículo que acabas de leer lo ha escrito completamente un humano o ha contado con ayuda de una IA? ¡Te animo a que lo compruebes tú mismo con alguna de las herramientas que hemos mencionado!
Cloud Híbrida
Ciberseguridad & NaaS
AI & Data
IoT y Conectividad
Business Applications
Intelligent Workplace
Consultoría y Servicios Profesionales
Pequeña y Mediana Empresa
Sanidad y Social
Industria
Retail
Turismo y Ocio
Transporte y Logística
Energía y Utilities
Banca y Finanzas
Deporte
Ciudades Inteligentes