Techiepedia: aprende tecnología con definiciones claras

Somos Telefónica Tech

Soluciones

Sectores

Casos de éxito

ESG

Actualidad

Techiepedia

En nuestro diccionario tecnológico te ofrecemos un glosario de términos esenciales en el mundo de IoT, Big Data, Blockchain e Inteligencia Artificial.

Casos de Éxito

Actualidad

A
B
C
D
E
F
G
H
I
J
K
L
M
N
Ñ
O
P
Q
R
S
T
U
V
W
X
Y
Z

B

Backup as a Service (BaaS)

Backup as a Service (BaaS)

Backup as a Service (BaaS)

Backup as a Service (BaaS)

Backup as a Service, o copia de seguridad como servicio, es una solución en la nube que permite a las empresas almacenar y proteger sus datos sin necesidad de infraestructuras físicas propias. El proveedor de BaaS se encarga de gestionar de forma remota la copia, el almacenamiento y la recuperación de la información.

Bayes (Clasificador Naive Bayes)

Naive Bayes classifier

Bayes (Clasificador Naive Bayes)

Naive Bayes classifier

Se trata de un grupo de algoritmos de clasificación basados en el Teorema de Bayes. No es un único algoritmo, sino una familia de ellos que comparten el principio común de que cualquier variable que clasifiquemos es independiente del valor de las otras variables. Por ejemplo, podemos considerar que una fruta es una manzana si es roja, redonda y de un tamaño determinado. Un clasificador Naive Bayes considera que cada una de estas características (roja, redonda, diámetro aproximado) contribuye de forma independiente a la probabilidad de que la fruta sea una manzana, independientemente de las correlaciones entre características. Sin embargo, las características no siempre son independientes, y por eso estos métodos se llaman “naive”. Sin embargo, esta simplificación permite desarrollar implementaciones de estos algoritmos fácilmente escalables.

Bayes (Estadística Bayesiana)

Bayesian Statistics

Bayes (Estadística Bayesiana)

Bayesian Statistics

Es un procedimiento matemático que aplica probabilidad a problemas estadísticos. Proporciona herramientas que permiten actualizar las predicciones con la evidencia de datos nuevos. Se diferencia de la aproximación clásica, basada en la frecuencia, y en su lugar usa probabilidad bayesiana para resumir la evidencia.

Bayes (Teorema de Bayes)

Bayes Theorem

Bayes (Teorema de Bayes)

Bayes Theorem

También conocido como Regla de Bayes, en honor del matemático y ministro presbiteriano del siglo XVIII Thomas Bayes. El teorema de Bayes se usa para calcular probabilidad condicionada. La probabilidad condicionada consiste en la probabilidad de que ocurra el evento “B” cuando un evento relacionado “A” ha ocurrido (P(B|A)).

Big Data

Big Data

Big Data

En general, se refiere a la capacidad de trabajar con volúmenes de datos que anteriormente eran inmanejables, tanto por su tamaño, velocidad y variedad (“Las 3 “V”s). Uno de los factores que ha permitido esta evolución ha sido la facilidad de distribución del almacenamiento y procesamiento de los datos a través de redes basadas en hardware básico (“commodity”), usando tecnologías Hadoop, en lugar de necesitar grandes y potentes computadoras dedicadas. Pero no es el volumen de datos lo importante. Es cómo las empresas usan estos datos para generar conocimiento (“insights”). Las empresas usan distintas técnicas, herramientas y recursos para dar sentido a estos datos y basar en ellos estrategias de negocio más eficientes.

Blockchain

Blockchain

Blockchain

Blockchain

Blockchain es un conjunto de tecnologías que permiten la transferencia de un valor o activo de un lugar a otro, sin intervención de terceros. En este modelo, la autenticidad no la verifica un tercero sino una red de nodos (computadores conectados a la red). Por ello, las transferencias de activos se realizan a través de un consenso y almacenando la información de manera transparente.

Blockchain empresarial

Enterprise blockchain

Blockchain empresarial

Enterprise blockchain

El blockchain empresarial es la aplicación de la tecnología de cadena de bloques en entornos corporativos para mejorar la seguridad, la transparencia y la eficiencia en la gestión de datos y transacciones. A diferencia del blockchain público, pensado para usos abiertos como las criptomonedas, el blockchain empresarial se despliega en redes privadas o híbridas controladas por las propias empresas o consorcios de varias compañías.

Bosque aleatorio

Random forest

Bosque aleatorio

Random forest

Se trata de un algoritmo usado para tareas de regresión o clasificación que se basa en una combinación de árboles predictores. “Para clasificar un nuevo objeto a partir de un vector de entrada, se alimenta cada uno de los árboles del bosque con ese vector. Cada árbol ofrece como resultado una clasificación, y decimos que “vota” por ese resultado. El bosque elige la clasificación que tiene más votos entre todos los árboles del bosque. El término “random forest” es una marca registrada por sus autores.

Bot

Bot

Bot

Bot

Bot, chatbot, talkbot, chatterbot, asistente conversacional, asistente virtual etc no son más que distintas formas de ponerle nombre a programas informáticos que se comunican con nosotros como si fueran humanos. Los bots pueden hacer muchas tareas, algunas buenas, como comprar entradas para un concierto, desbloquear la cuenta de un usuario, u ofrecer opciones para reservar una casa de vacaciones en unas fechas concretas; y otras no tanto, como realizar ciberataques, o provocar una catástrofe financiera realizando operaciones bursátiles a alta velocidad.

Los bots (diminutivo de “robot”) pueden estar diseñados en cualquier lenguaje de programación y funcionar como cliente, como servidor, como agente móvil etc. Cuando se especializan en una función específica se les suele llamar “Sistemas Expertos”.

Business Intelligence (Inteligencia de negocio)

Business Intelligence (BI)

Business Intelligence (Inteligencia de negocio)

Business Intelligence (BI)

Business Intelligence, o inteligencia de negocio, es el conjunto de procesos, metodologías y herramientas que permiten a las empresas transformar datos en información útil para la toma de decisiones. Se basa en recopilar, integrar y analizar datos procedentes de distintas fuentes internas y externas.

D

DFIR

DFIR

DFIR

DFIR, o Digital Forensics & Incident Response, es la disciplina que combina la investigación forense digital con la respuesta a incidentes de ciberseguridad. Su objetivo es analizar en profundidad un ataque, contenerlo y comprender qué ha ocurrido para prevenir futuros incidentes. Incluye la recopilación y preservación de evidencias digitales, el análisis técnico del ataque y la aplicación de medidas correctivas.

Dark Web

Dark Web

Dark Web

La Dark Web es una parte de internet que no está indexada por buscadores convencionales y que requiere herramientas de anonimato o cifrado para acceder. En este entorno conviven desde espacios dedicados a la privacidad legítima hasta actividades ilícitas que incluyen foros, canales de comunicación y mercados clandestinos.

Datos de prueba

Holdout data

Datos de prueba

Holdout data

Se trata de ejemplos que, de forma intencionada, (son “retenidos”) no se usan durante el entrenamiento. Los conjuntos de datos de validación y datos de test, son ejemplos de datos de prueba. Estos datos ayudan a evaluar la bondad de un modelo para generalizar sobre datos distintos de los usados para entrenarlo. La función de pérdida en los datos de prueba da una mejor estimación del valor sobre datos nuevos que la que da esta función sobre los datos de entrenamiento.

Datos estructurados   

Structured data  

Datos estructurados   

Structured data  

Los datos estructurados son los datos típicos de la mayoría de bases de datos relacionales (RDBMS). Estas bases de datos se caracterizan por tener un esquema determinado que define cómo son las tablas en las que se almacenan los datos, qué tipo de campos tienen y cómo se relacionan entre ellas.

Datos no-estructurados   

Unstructured data  

Datos no-estructurados   

Unstructured data  

Los datos no estructurados suponen un 80% del volumen de todos los datos generados, porcentaje que no deja de crecer. Estos datos pueden tener una estructura interna, pero no siguen ningún esquema o modelo de datos predefinido. Pueden ser datos de texto, o no textuales; haber sido generados por una máquina o por una persona; y almacenarse en una base de datos NoSQL, o directamente en un Datalake.

Datos semi-estructurados   

Semi-structured data

Datos semi-estructurados   

Semi-structured data

Datos semi-estructurados no tienen un esquema definido. No encajan en un formato de tablas/filas/columnas, sino que se organizan mediante etiquetas o “tags” que permiten agruparlos y crear jerarquías. También se les conoce como no relacionales o NoSQL.

Deepfake

Deepfake

Deepfake

Un deepfake es un contenido manipulado mediante técnicas de inteligencia artificial, especialmente aprendizaje profundo (deep learning), que sustituye o altera la voz, el rostro o el cuerpo de una persona en fotos, audios o vídeos, de forma tan realista que resulta difícil distinguirlo de la realidad.

DevSecOps

DevSecOps

DevSecOps

DevSecOps es una metodología que integra la seguridad en cada fase del ciclo de vida del desarrollo de software. Combina las prácticas de desarrollo (Dev), operaciones (Ops) y seguridad (Sec) para que los equipos trabajen de forma colaborativa, incorporando controles de seguridad desde el diseño hasta el despliegue de las aplicaciones.

Disaster Recovery as a Service (DRaaS)

Disaster Recovery as a Service (DRaaS)

Disaster Recovery as a Service (DRaaS)

Disaster Recovery as a Service (DRaaS)

Disaster Recovery as a Service, o recuperación ante desastres como servicio, es una solución en la nube que permite a las empresas restaurar sus sistemas de TI y aplicaciones críticas tras un incidente grave. A través de un proveedor especializado, la infraestructura se replica y mantiene disponible para garantizar que el negocio pueda seguir funcionando incluso en caso de desastre.

Disponibilidad (Gobierno del Dato)

Availability (Data Governance)

Disponibilidad (Gobierno del Dato)

Availability (Data Governance)

Propiedad que debe cumplir la información contenida en un sistema de información por la cual, dicha información se encuentre disponible para ser consultada o modificada cuando un usuario con los permisos adecuados así lo requiera.

Distribución de probabilidad

Probability distribution

Distribución de probabilidad

Probability distribution

La distribución de probabilidad de una variable aleatoria discreta es el conjunto de todos los posibles valores que puede tener esa variable, junto con sus probabilidades de ocurrencia.

Para variables discretas, las principales distribuciones de probabilidad son la binonial, la de Poisson y la hipergeométrica (esta última para eventos dependientes). Para variable continua, la distribución que se genera es la normal o gaussiana.

Drones

Drones

Drones

Drones

Un Drone es un vehículo aéreo no tripulado (VANT) y que vuela por control remoto. En la actualidad tiene diferentes funciones que aportan gran valor a la sociedad, por ejemplo: ayuda a la disminución de accidentes en carreteras, la detección de un fuego en campo abierto, ayuda al riego más eficaz en campos de cultivo…

E

ERP (Enterprise Resource Planning)

ERP (Enterprise Resource Planning)

ERP (Enterprise Resource Planning)

ERP (Enterprise Resource Planning)

Un ERP, o Enterprise Resource Planning, es un sistema de software que integra en una sola plataforma los procesos clave de una empresa, como finanzas, compras, inventario, producción, recursos humanos y logística. Su finalidad es centralizar la información y mejorar la eficiencia operativa.

Edge Convergente

Edge Convergence

Edge Convergente

Edge Convergence

Edge convergente es un modelo que combina redes privadas 5G con Edge Computing para unificar conectividad y capacidad de procesamiento en el propio entorno industrial. Esta convergencia permite ejecutar procesos críticos de forma local y en tiempo real, sin depender de la nube pública ni de redes externas.

Escalar

Scalar

Escalar

Scalar

Una variable es de tipo escalar (por oposición a vectorial), cuando tiene un valor de magnitud pero no dirección en el espacio, como por ejemplo, el volumen o la temperatura.

Estrato, muestreo estratificado

Strata, stratified sampling

Estrato, muestreo estratificado

Strata, stratified sampling

Consiste en dividir las muestras de población en grupos homegéneos o estratos y tomar una muestra aleatoria de cada uno de ellos. Strata es también una conferencia de O´Reilly sobre Big Data, Data Science y tecnologías relacionadas.

Exactitud y Sensibilidad

Precision and Recall

Exactitud y Sensibilidad

Precision and Recall

La exactitud (en inglés “Precision”) es una métrica para modelos de clasificación que responde a la siguiente pregunta: ¿De todos los resultados que el modelo da como positivos, cuántos son positivos de verdad?

Representa lo cerca que está del valor verdadero el resultado del modelo o medición. También se conoce como Verdadero Positivo (o “True positive rate”).

La Sensibilidad indica cuántas de las predicciones positivas son correctas.

La exactitud y la sensibilidad nos están indicando la relevancia de los resultados. Por ejemplo, un algoritmo muy exacto, (P alto) nos dará muchos más resultados relevantes que irrelevantes, mientras que un algoritmo muy específico, (TP alto), será el que detecte la mayoría de resultados de interés (los primeros).

Experiencia de Clientes

Customer Experience

Experiencia de Clientes

Customer Experience

La experiencia de usuario es el conjunto de factores y acciones que se llevan a cabo cuando el usuario interactúa con un producto o entorno. La percepción que la persona tenga en cada caso puede ser tanto positiva como negativa e influirá en el proceso de compra que pueda darse, o no. Esta percepción puede venir dada de muchos factores diferentes como el diseño, emociones, sentimientos, experiencia de marca, confiabilidad del producto, etc.

F

Función de activación

Activation function

Función de activación

Activation function

Una función de activación es una función que transmite la información generada por la combinación lineal de los pesos y las entradas, es decir son la manera de transmitir la información por las conexiones de salida. Como lo que queremos es que la red sea capaz de resolver problemas cada vez más complejos, las funciones de activación generalmente harán que los modelos sean no lineales. Las más conocidas son la función escalón, la sigmoidal, las funciones ReLu, de tangente hiperbólica o de base radial (Gausianas, multicuadráticas, multicuadráticas inversas)

G

Gestión de identidades privilegiadas (PAM)

Privileged Access Management (PAM)

Gestión de identidades privilegiadas (PAM)

Privileged Access Management (PAM)

La gestión de identidades privilegiadas, conocida como PAM por sus siglas en inglés (Privileged Access Management), es un conjunto de prácticas y tecnologías diseñadas para controlar y proteger las cuentas con mayores permisos dentro de una empresa, como administradores de sistemas o responsables de bases de datos.

Gestión de identidades y accesos (IAM)

Identity and Access Management (IAM)

Gestión de identidades y accesos (IAM)

Identity and Access Management (IAM)

La gestión de identidades y accesos (IAM) por sus siglas en inglés: Identity and Access Management, es el conjunto de políticas, procesos y tecnologías que permiten a las empresas gestionar de forma segura la identidad digital de sus usuarios y controlar su acceso a sistemas, aplicaciones y datos.

Gestión de vulnerabilidades

Vulnerability management

Gestión de vulnerabilidades

Vulnerability management

La gestión de vulnerabilidades es el proceso mediante el cual las empresas identifican, evalúan y corrigen debilidades en sus sistemas, aplicaciones y redes. El objetivo es reducir la probabilidad de que esas fallas sean explotadas por atacantes y proteger los activos críticos del negocio.

Github

Github

Github

GitHub es una compañía no lucrativa que ofrece un servicio de hosting de repositorios almacenados en la nube. Fue comprada por Microsoft en 2018. GitHub se basa en la colaboración entre usuarios favoreciendo que varios desarrolladores experimenten con código abierto y compartan sus distintos proyectos e ideas.

Gobierno del Dato

Data Governance

Gobierno del Dato

Data Governance

Conjunto de políticas y buenas prácticas que habilitan procesos que tienen como objetivo promocionar los datos como activo dentro de una organización para mejorar la toma de decisiones.

H

Hadoop

Hadoop

Hadoop

Hadoop es un proyecto opensource de la Apache Foundation, introducido en 2006, y desarrollado en Java cuyo objetivo es ofrecer un entorno de trabajo acorde con las necesidades del Big Data. Hadoop, por tanto, está diseñado para trabajar con volúmenes de datos masivos (Volumen), estructurados o no (Variedad), y procesarlos de forma segura y eficiente (Veracidad/Velocidad) , tanto en costes como en tiempo.

Para ello, distribuye, tanto el almacenamiento de la información, como su procesamiento, entre muchos equipos trabajando de forma coordinada en “ clusters”, con uno o varios nodos maestros encargados de gestionar, por una parte, el sistema de ficheros distribuido donde los datos se almacenan en diferentes bloques redundados; y por otra, la coordinación y ejecución de los distintos jobs o tareas entre los miembros del cluster. Por ello es un sistema altamente escalable que además ofrece redundancia por software.

Heurístico

Heuristic

Heurístico

Heuristic

Un método heurístico consiste en buscar una solución práctica a un problema, aunque no sea óptima, pero suficiente para seguir avanzando o aprender de ello.

“En algunas ciencias, manera de buscar la solución de un problema mediante métodos no rigurosos, como por tanteo, reglas empíricas, etc”. (RAE)

Hiperescalar (Hiperescalador)

Hyperscaler

Hiperescalar (Hiperescalador)

Hyperscaler

Un hiperescalar es un proveedor de servicios cloud capaz de ofrecer infraestructuras masivas, escalables y automatizadas que crecen o se reducen en función de la demanda. Se caracterizan por operar centros de datos distribuidos globalmente y por ofrecer servicios avanzados en ámbitos como computación, almacenamiento, redes o inteligencia artificial.

Hiperplano

Hyperplane

Hiperplano

Hyperplane

Es un límite que separa el espacio en dos subespacios. Por ejemplo, una línea es un hiperplano en dos dimensiones, y un plano es un hiperplano en tres. En aprendizaje automático, un hiperplano es el límite que separa un espacio de muchas dimensiones. Los algoritmos Kernel Support Vector Machine usan hiperplanos para separar las clases positivas de las negativas en espacios multidimensionales.

Hosting

Hosting

Hosting

Hosting

Servicio que permite almacenar y publicar sitios web, aplicaciones o correos electrónicos en servidores físicos o virtuales, haciéndolos accesibles en Internet. Incluye la gestión de recursos como espacio en disco, ancho de banda y direcciones IP.

J

K

k-means clustering

k-means clustering

k-means clustering

k-means clustering

Es un tipo de Algoritmo supervisado que se usa para tareas de clustering. Es un proceso que de forma sencilla clasifica un conjunto de datos en cierto número de clusters o agrupaciones (digamos “k” clusters). Los datos son homogéneos dentro de cada cluster y heterogéneos respecto a los datos de clusters vecinos.

k-vecino más próximo

k-nearest neighbors

k-vecino más próximo

k-nearest neighbors

El Algoritmo K nearest neighbors es un sencillo algoritmo de clasificación que clasifica la probabilidad de que un elemento x pertenezca a una determinada clase, basándose en información sobre sus “k” vecinos. Al nuevo elemento se le asigna la clase más común entre sus vecinos más próximos, según una función distancia. Estas funciones distancia pueden ser de varios tipos: Euclídea, Manhattan, Minkowski o Hamming. Las tres primeras se usan para funciones continuas, y la cuarta, para variables categóricas.

L

Legato

Legato

Legato

Legato (por ejemplo, Legato Sapient) es un sistema MES (Manufacturing Execution System) usado en entornos industriales para supervisar, controlar y optimizar las operaciones de producción en tiempo real. Facilita la integración entre planta (máquinas, sensores) y sistemas de gestión.

Librería estándar (Python)

Python Standard Library

Librería estándar (Python)

Python Standard Library

Una librería no es más que un conjunto de módulos (ver módulos). La librería estándar de Python es muy amplia y ofrece una gran variedad de módulos que realizan funciones de todo tipo, desde módulos escritos en C que ofrecen acceso a funcionalidades del sistema como el acceso a ficheros (file I/O). En la web de Python se puede encontrar una referencia a todos los módulos en “ The Python Standard Library”. Los instaladores de Python para plataformas Windows, normalmente incluyen la librería estándar completa, incluso algunos componentes adicionales. Sin embargo, en las instalaciones Python mediante paquetes harán falta instaladores específicos.

Lingüística computacional

Computational linguistics

Lingüística computacional

Computational linguistics

Conocido también como procesamiento de lenguaje natural PLN. Es una rama de las ciencias de la computación que analiza el lenguaje hablado (por ejemplo, en chino o inglés) y lo convierte en datos estructurados que se pueden usar como comandos lógicos en un programa. En un principio, el foco estaba en traducir de un lenguaje a otro, o aceptar frases completas como consultas a bases de datos. En la actualidad, los esfuerzos se centran en analizar documentos y otros datos (por ejemplo tweets), para extraer información potencialmente valiosa.

Low-code / No-code

Low-code / No-code

Low-code / No-code

Low-code / No-code

Low-code y no-code son enfoques de desarrollo de aplicaciones que reducen o eliminan la necesidad de programar código de forma tradicional.

N

NB-IoT

NB-IoT

NB-IoT

NB-IoT

NB-IoT son las primeras tecnologías estándar 3GPP diseñadas ad hoc para IoT en las bandas con licencia. Ambas tecnologías forman parte de las redes LPWA (low power wide area) y se han diseñado para optimizar el consumo masivo de Low Data y usos de IoT de bajo coste. Gracias a esta tecnología podemos reducir el coste de los dispositivos y extender la vida útil de las baterías durante años. Además, aporta una mejor cobertura tanto en interiores (sitios de cobertura complicados: por ejemplo, sótanos) como en exteriores (largo alcance).

NFT corporativo

Corporate NFT

NFT corporativo

Corporate NFT

Un NFT corporativo (Non-Fungible Token) es un activo digital único y no intercambiable que utiliza tecnología blockchain para certificar su autenticidad y propiedad. En el ámbito empresarial, los NFT se emplean más allá del arte digital, como herramienta para garantizar trazabilidad, autenticidad de documentos o gestión de activos digitales.

Nuevas tecnologías

New technologies

Nuevas tecnologías

New technologies

Las nuevas tecnologías son técnicas no usadas con anterioridad, si no que han surgido en los últimos años dentro de los campos de la informática y la comunicación. Son pequeños avances de la humanidad que ayudan a evolucionar a las personas y les hacen la vida más fácil. Es su día herramientas como Intenet, el DVD, los ordenadores de mesa, los ordenadores portátiles fueron ejemplos de este concepto. Hoy día compendemos como nuevas tecnologías conceptos como IoT, Big Data, Inteligencia Artificial, Realidad Virtual…

Ñ

O

Observability

Observabilidad

Observability

La observabilidad es la capacidad de comprender el estado interno de sistemas complejos a partir de los datos que generan, como métricas, logs y trazas. Va más allá del simple monitoring, ofreciendo una visión integral y en tiempo real.

P

Perceptrón

Perceptron

Perceptrón

Perceptron

El algoritmo perceptrón fue creado a finales de los años 50. Su primera implementación fue como hardware, de hecho, fue la primera red neuronal que se creó. El perceptrón es un algoritmo de aprendizaje supervisado para clasificadores binarios. Es un clasificador lineal, es decir, un algoritmo de clasificación basado en una función linear que aplica una serie de funciones peso a los valores de entrada, y pasa los valores de esta suma ponderada a una función cuyo resultado de salida es “o”. El perceptron es la red neuronal más sencilla, ya que simula el funcionamiento de una única neurona con n valores de entrada binarios. Calcula una suma ponderada de los valores de entrada y se dispara si esa suma es cero o mayor.

Perfilado

Profiling

Perfilado

Profiling

El perfilado es el proceso de usar datos personales para evaluar ciertos aspectos personales para analizar y predecir el comportamiento / rendimiento / fiabilidad, etc.

Phishing

Phishing

Phishing

El phishing es una técnica de ciberataque que utiliza mensajes falsos (habitualmente correos electrónicos, SMS o llamadas) para engañar a los usuarios y hacerles entregar información confidencial, como credenciales de acceso o datos bancarios. Los atacantes suplantan la identidad de entidades legítimas para ganar la confianza de la víctima.

Potenciación del gradiente

Gradient Boosting

Potenciación del gradiente

Gradient Boosting

Gradient boosting o Potenciación del gradiente, es una técnica de aprendizaje automático utilizado para el análisis de la regresión y para problemas de clasificación estadística, el cual produce un modelo predictivo en forma de un conjunto de modelos de predicción débil, normalmente, árboles de decisión. Construye el modelo de forma iterativa y lo generaliza permitiendo la optimización de una función pérdida diferenciable arbitraria. (Wikipedia)

Precisión

Accuracy

Precisión

Accuracy

La fracción de predicciones correctas hechas por un modelo de clasificación. En un modelo multiclase, la precisión se define de la siguiente forma:

Precisión=Predicciones correctas/Número total de ejemplos

En el caso de clasificación binaria, la definición es:

Precisión= (Verdaderos Positivos + Verdaderos Negativos) /Número total de ejemplos

Procesado de lenguaje natural (PLN)

Natural language processing (NLP)

Procesado de lenguaje natural (PLN)

Natural language processing (NLP)

El Procesado de Lenguaje Natural es la rama dentro del ámbito de las Ciencias de la Computación, la Lingüística y la Inteligencia Artificial que se encarga del estudio y desarrollo de técnicas que permitan a los ordenadores entender y procesar el lenguaje humano.

Procesador de datos

Data Processor – Procesador de datos

Procesador de datos

Data Processor – Procesador de datos

A menudo un tercero encargado de recopilar datos en nombre del controlador (a efectos RGDP)

Python

Python

Python

Es un lenguaje de programación creado en 1994 y que es muy usado en ciencia de datos. Para los principiantes, resulta muy sencillo de aprender, pero al mismo tiempo es un lenguaje muy potente para usuarios avanzados, ya que dispone de librerías especializadas para aprendizaje automático y generación de gráficos.

Q

S

SASE

SASE

SASE

SASE (Secure Access Service Edge) es un modelo de red y seguridad en la nube que integra funciones de conectividad (como SD-WAN) y seguridad (Zero Trust, firewall en la nube, control de acceso) en un único servicio gestionado.

SIEM

SIEM

SIEM

SIEM, por sus siglas en inglés Security Information and Event Management, es una solución de ciberseguridad que centraliza y analiza en tiempo real los registros (logs) generados por sistemas, aplicaciones y dispositivos de una empresa. Su objetivo es detectar patrones anómalos y amenazas de manera temprana.

SOAR

SOAR

SOAR

SOAR (Security Orchestration, Automation & Response, Orquestación, Automatización y Respuesta en Seguridad) es una tecnología diseñada para unificar y coordinar la operación de ciberseguridad de una empresa.

SOC (Security Operations Center)

SOC (Security Operations Center)

SOC (Security Operations Center)

SOC (Security Operations Center)

Un Security Operations Center (SOC, Centro de Operaciones de Seguridad) es un centro especializado en monitorizar, detectar, analizar y responder a incidentes de ciberseguridad en tiempo real. Reúne tecnología, procesos y equipos humanos expertos para proteger la infraestructura digital de una empresa las 24 horas del día.

Segmentación

Clustering

Segmentación

Clustering

Es un método de aprendizaje no supervisado que se usa para descubrir agrupamientos inherentes a los datos. Por ejemplo, agrupamiento de clientes según sus hábitos de compra para de esta forma segmentarlos. De esta forma, las empresas pueden definir las estrategias de marketing más apropiadas para incrementar sus beneficios. Ejemplos de algoritmos de clustering son: K-Means, clustering jerárquico etc.

Sensibilidad y Especifidad

Sensitivity and Specificity

Sensibilidad y Especifidad

Sensitivity and Specificity

Son métricas estadísticas que se usan para medir el rendimiento de un clasificador binario.

La Sensibilidad (También llamada tasa de verdadero positivo, o probabilidad de detección en algunos campos) mide la proporción de casos positivos correctamente identificados por el algoritmo clasificador. Por ejemplo, el porcentaje de personas que padecen una enfermedad y que son correctamente detectadas. Su fórmula es:

Sensibilidad=Verdaderos Positivos/ (Verdaderos Positivos + Falsos Negativos)

La Especificidad (también llamada tasa de verdaderos negativos) mide la proporción de casos negativos correctamente identificados como tales por el algoritmo clasificador. Por ejemplo, se usa para indicar el número de personas sanas que han sido correctamente identificadas como tales por el algoritmo.

Especifidad=Verdaderos Negativos/ (Verdaderos Negativos + Falsos Positivos)

Sensores IoT

IoT Sensors

Sensores IoT

IoT Sensors

Un sensor IoT es un dispositivo capaz de detectar, medir o indicar los cambios que se producen en un espacio/objeto físico, los transforma en una señal eléctrica y los cuelga de manera legible en una plataforma de conectividad. Estos sensores pueden medir multitud de variables (localización, temperatura, humedad, presión, velocidad…). Por si solos no serían útiles, por ello, todos los datos recogidos se cuelgan en una plataforma donde, a través del Big Data, podemos analizarlos y crear patrones de comportamiento para poder definir los valores y conseguir un valor añadido del dispositivo.

Serie espacio-temporal

Spatiotemporal data

Serie espacio-temporal

Spatiotemporal data

Son series temporalis de datos que también incluyen identificadores geográficos, como pares de coordenadas de latitud-longitud.

Serie temporal

Time series data

Serie temporal

Time series data

Una serie temporal es una secuencia de medidas espaciadas en el tiempo intervalos no necesariamente iguales. Así las series temporales constan de una medida (por ejemplo, presión atmosférica o precio de una acción) acompañada de un sello temporal.

Sesgo

Bias

Sesgo

Bias

Es el término independiente en el origen. En los modelos de machine learning (aprendizaje automático) suele denominarse b o w0. En la siguiente fórmula sería el término b.

y′=b+w1x1+w2x2+…wnxn

En machine learning se llama sesgo a la tendencia del que aprende a repetir el mismo error de forma consistente. La Varianza es la tendencia a aprender hechos aleatorios sin tener en cuenta la señal. En ocasiones, por evitar la varianza (overfitting) se cae en el error opuesto, el sesgo (underfitting).

Seudonimización

Pseudonymization

Seudonimización

Pseudonymization

El proceso de seudonimización es una alternativa a la anonimización de datos. Mientras que la anonimización implica eliminar por completo toda la información identificable, la seudonimización pretende eliminar el vínculo entre un conjunto de datos y la identidad del individuo. Los ejemplos de seudonimización son encriptación y tokenización.

Sistema experto

Expert system

Sistema experto

Expert system

Es un sistema que emplea conocimiento humano capturado en un ordenador para resolver problemas que normalmente resolverían humanos expertos. Los sistemas bien diseñados imitan el proceso de razonamiento que los expertos utilizan para resolver problemas específicos. Estos sistemas pueden funcionar mejor que cualquier humano experto tomando decisiones individualmente en determinados dominios y pueden ser utilizados por humanos no expertos para mejorar sus habilidades en la resolución de problemas.

Soberanía digital

Digital sovereignty

Soberanía digital

Digital sovereignty

Es el principio por el cual las empresas y los países buscan garantizar que sus datos y tecnologías críticas se gestionen bajo sus propias normas, sin dependencia excesiva de proveedores externos ni exposición a legislaciones extranjeras.

Sobreajuste

Overfitting

Sobreajuste

Overfitting

Un modelo está “sobreajustado” cuando se han tenido en cuenta tantas peculiaridades y valores anónimos que el modelo se ha vuelto excesivamente complicado y no es aplicable a ningún conjunto de datos, salvo para el que se ha usado para entrenarlo.

Sujeto de datos

Data Subject

Sujeto de datos

Data Subject

El individuo cuyos datos se están utilizando (a efectos RGPD)

Superficie de ataque

Attack surface

Superficie de ataque

Attack surface

La superficie de ataque es el conjunto de puntos de entrada que un ciberdelincuente podría aprovechar para intentar acceder a los sistemas de una empresa. Incluye dispositivos, aplicaciones, usuarios, servicios en la nube y cualquier otro recurso conectado a la red.

T

Tabla pivotante o tabla dinámica

Pivot table

Tabla pivotante o tabla dinámica

Pivot table

Las tablas dinámicas resumen de forma ágil y rápida largas listas de datos, sin necesidad de escribir fórmulas o copiar celdas. Pero su característica más importante es que se pueden reorganizar de forma dinámica. Con tan sólo mover el ratón, se puede reorganizar la tabla pivot de forma que resuma los datos agrupándolos, por ejempo, por género, por edad o por localización geográfica. El proceso de reorganizar la tabla se conoce como “pivotar los datos”. Consiste en distribuir la información de forma que se puede examinar desde distintos ángulos. El término tabla pivot es una frase genérica utilizada por múltiples proveedores. Sin embargo, Microsoft Corporation ha registrado la marca específica de "PivotTable".

Tecnología 5G

Fifth Generation Technology (5G)

Tecnología 5G

Fifth Generation Technology (5G)

El 5G es una de las nuevas conectividades que se están implementando en diferentes países cuya principal función es la de soportar velocidades de subida de información muy superiores a cualquier otra tecnología creada hasta el momento. Esto permite que, para los servicios que disfruten de esta tecnología, el envío de información sea todavía más rápido que el actual.

Tecnología de registro distribuido (DLT)

Distributed Ledger Technology (DLT)

Tecnología de registro distribuido (DLT)

Distributed Ledger Technology (DLT)

Un Distributed Ledger Technology (DLT), o tecnología de registro distribuido, es una base de datos compartida entre múltiples participantes en la que la información se valida, sincroniza y almacena de forma descentralizada. No depende de una autoridad central, lo que garantiza transparencia e inmutabilidad en las transacciones.

Tensor

Tensor

Tensor

Tensor

Los tensores son objetos matemáticos que almacenan valores numéricos y que pueden tener distintas dimensiones. Así, por ejemplo, un tensor de 1D es un vector, de 2D una matriz, de 3D un cubo etc

Tienda conectada

Smart Retail

Tienda conectada

Smart Retail

La tienda conectada también es conocida por otros nombre como tienda IoT, tienda del futuro o tienda inteligente. En definitiva, una tienda conectada es un comercio tradicional que ha pasado por una transformación digital y ha adaptado sus espacios a nuevos escenarios con dispositivos IoT para ofrecer a sus clientes una mejor experiencia de usuario. Las marcas, se están esforzando en adaptar las ventajas del comercio online a los puntos de venta físicos para atraer nuevos clientes, incrementar las ventas y aumentar su fidelidad hacia la marca.

Tokenization

Tokenización

Tokenization

La tokenización es una técnica de seguridad que sustituye datos sensibles (como números de tarjeta, credenciales o información personal) por valores alternativos llamados tokens. Estos tokens no tienen valor fuera del sistema que los genera, lo que protege la información original frente a robos o filtraciones.

Transformación Digital

Digital Transformation

Transformación Digital

Digital Transformation

La transformación digital es la reinvención de una empresa mediante la implementación de capacidades digitales a sus procesos, productos y activos para ser más eficientes, ofrecer una mejor experiencia al usuario y ahorrar en costes.

Transparencia (Gobierno del Dato)

Transparency (Data Governance)

Transparencia (Gobierno del Dato)

Transparency (Data Governance)

Concepto sobre el que se fundamenta la forma que los usuarios tienen para ser conscientes de la información almacenada por el servicio, dar y poder revocar su consentimiento explícito y poder tener acceso a revocarlo durante la operación del mismo y tener garantías de que se ha eliminado al terminar el mismo.

Tratamiento de datos

Data wrangling

Tratamiento de datos

Data wrangling

Consiste en convertir los datos, normalmente por medio de lenguajes de script, en un formato en el que resulte más fácil trabajar con ellos. Es una tarea que consume mucho tiempo.

U

Unidad de procesamiento gráfico (GPU)

Graphics processing unit (GPU)

Unidad de procesamiento gráfico (GPU)

Graphics processing unit (GPU)

La unidad de procesamiento gráfico (GPU) es el componente hardware que se encarga de que el contenido se muestre correctamente en la pantalla o monitor del ordenador. Gestiona desde la interfaz de usuario hasta aplicaciones y páginas web y, por supuesto, juegos.

El uso de la computación paralela masiva con GPUs ha sido clave para el desarrollo del Deep Learning.

V

Validación cruzada

Cross-validation

Validación cruzada

Cross-validation

Se usa en la aplicación de algoritmos a conjuntos de datos. Consiste en un conjunto de técnicas que dividen los datos en datos de entrenamiento y datos de test. Los datos de entrenamiento se introducen en el algoritmo, junto con las respuestas correctas, y así “aprende” de los datos. Una vez entrenado, el algoritmo es capaz de predecir las respuestas correctas para cada uno de los datos de entrada del conjunto de datos de test. Las respuestas que da el algoritmo se comparan con los valores reales y así se puede estimar si el algoritmo lo hizo bien.

Valores anómalos

Outlier

Valores anómalos

Outlier

Son valores extremos que pueden ser debidos a errores de medición o registro de los datos, o bien reflejo de eventos reales, pero poco frecuentes.

Variable categórica

Categorical Variable

Variable categórica

Categorical Variable

Las variables categóricas (o variables nominales) son aquellas que tienen valores cualitativos discretos. Por ejemplo, los nombres de ciudades como Madrid, Valencia, Bilbao, son categóricos.

Variable continua

Continuous variable

Variable continua

Continuous variable

Se trata de variables cuyo valor puede ser cualquiera que se pueda expresar con un número decimal. La edad, o el tamaño, pueden ser variables continuas. Tiene 2,5 años. Su representación gráfica es una función continua. Las variables discretas, por el contrario, se expresan por números enteros, o valores concretos como por ejemplo “hombre”, “mujer”, “sí” o “no”.

Variable dependiente

Dependent Variable

Variable dependiente

Dependent Variable

Se llama variable dependiente porque su valor tiene que ver (“depende”) con el de la variable dependiente. Si estamos midiendo el efecto que tiene el volumen del presupuesto de publicidad sobre las ventas totales, el presupuesto de publicidad sería la variable independiente y las ventas totales, sería la dependiente.

Variable discreta

Discrete Variable

Variable discreta

Discrete Variable

Se trata de una variable cuyos valores potenciales pertenecen a un conjunto específico de valores. Por ejemplo, si alguien califica una película entre una y cinco estrellas y no están permitidos valores fracción de estrella (por ejemplo, cuatro estrellas y media), la variable calificación es una variable discreta. En una representación gráfica, las variables discretas se expresan en forma de histogramas.

Vector

Vector

Vector

Vector

La definición matemática de un vector es “una cantidad que tiene una magnitud y una dirección, representada por una flecha cuya longitud representa la magnitud y cuya orientación en el espacio representa la dirección”. Sin embargo, los científicos de datos utilizan el término en este sentido: “conjunto ordenado de números reales que denotan una distancia sobre un eje de coordenadas. Estos números pueden representar características de una persona, película, producto o lo que queramos modelar. Esta representación matemática de las variables permite trabajar con librerías de software que aplican operaciones de matemáticas avanzadas a los datos.

Un espacio vectorial es un conjunto de vectores, por ejemplo, una matriz.

W

X

XDR

XDR

XDR

XDR, o Extended Detection and Response, es una solución de ciberseguridad que integra y correlaciona datos de múltiples fuentes (endpoints, redes, servidores, aplicaciones y correo electrónico) para detectar amenazas avanzadas y responder de manera más eficaz.

Y

Z

Zero Trust

Zero Trust

Zero Trust

Zero Trust es un modelo de seguridad basado en el principio de “nunca confiar, siempre verificar”. En lugar de asumir que lo que está dentro de la red es seguro, exige validar continuamente la identidad de los usuarios y dispositivos, así como el nivel de confianza de cada transacción.

Descubre más sobre nosotros

📶 Cerramos el 2025 con 17 millones de líneas IoT en España, consolidando una posición de referencia en el mercado y un crecimiento muy significativo en lo que va de año.

18 DE DICIEMBRE, 2025

Síguenos en LinkedIn
¡Ya está aquí nuestro Wrapped de equipo 2025! 🙌💙 Personas, momentos y experiencias que han marcado nuestro año y nos han hecho sentir muy, pero que muy #ProudToBeTech.

19 DE DICIEMBRE, 2025

Síguenos en Instagram
¡Ya está aquí nuestro cuaderno de casos de éxito del 2025! 🚀 Este año hemos acompañado a nuestros clientes en su #TransformaciónDigital, superando retos y alcanzando nuevas metas con la tecnología como aliada.

16 DE DICIEMBRE, 2025

Síguenos en X