Learn Without Walls
← Introduction to Statistics Course

Statistics Glossary

44 key terms from probability, inference, and regression — in English, Arabic, and Spanish.

A B C D E F H I M N O P Q R S T V Z

A

EN Alternative Hypothesis (H₁)

The statement that contradicts the null hypothesis and represents what the researcher suspects is true. It claims that there is a real effect, difference, or relationship in the population. If the p-value is small enough, we reject the null in favor of the alternative.

AR الفرضية البديلة (H₁)

العبارة التي تتعارض مع الفرضية الصفرية وتمثل ما يعتقد الباحث أنه صحيح. تدّعي وجود تأثير حقيقي أو فرق أو علاقة في المجتمع الإحصائي. إذا كانت القيمة الاحتمالية صغيرة بما يكفي، نرفض الفرضية الصفرية لصالح البديلة.

ES Hipótesis alternativa (H₁)

La afirmación que contradice la hipótesis nula y representa lo que el investigador sospecha que es verdad. Afirma que existe un efecto, diferencia o relación real en la población. Si el valor p es suficientemente pequeño, se rechaza la nula en favor de la alternativa.

EN ANOVA (Analysis of Variance)

A statistical test used to compare the means of three or more groups simultaneously. It determines whether at least one group mean is significantly different from the others. ANOVA uses the F-statistic and partitions total variability into between-group and within-group components.

F = (variance between groups) / (variance within groups)
AR تحليل التباين (ANOVA)

اختبار إحصائي يُستخدم لمقارنة متوسطات ثلاث مجموعات أو أكثر في آنٍ واحد. يحدد ما إذا كان متوسط مجموعة واحدة على الأقل يختلف اختلافًا جوهريًا عن المجموعات الأخرى. يستخدم ANOVA إحصائية F ويقسّم التباين الكلي إلى مكوّن بين المجموعات ومكوّن داخلها.

ES ANOVA (Análisis de varianza)

Una prueba estadística para comparar las medias de tres o más grupos simultáneamente. Determina si al menos la media de un grupo difiere significativamente de las demás. ANOVA usa el estadístico F y descompone la variabilidad total en componentes entre grupos y dentro de grupos.

B

EN Bar Chart

A graph that uses rectangular bars to represent the frequency or value of categorical data. Each bar corresponds to a category, and the height (or length) of the bar reflects its count or proportion. Bar charts are one of the most common tools for displaying categorical data.

AR مخطط الأعمدة

رسم بياني يستخدم أعمدة مستطيلة لتمثيل تكرار أو قيمة البيانات الفئوية. يقابل كل عمود فئةً معينة، ويعكس ارتفاع العمود (أو طوله) عدد المشاهدات أو نسبتها. يُعدّ مخطط الأعمدة من أكثر الأدوات شيوعًا لعرض البيانات الفئوية.

ES Gráfico de barras

Un gráfico que usa barras rectangulares para representar la frecuencia o el valor de datos categóricos. Cada barra corresponde a una categoría y su altura refleja el conteo o la proporción. Es una de las herramientas más comunes para mostrar datos categóricos.

EN Bell Curve

The informal name for the normal distribution, whose graph resembles the shape of a bell — symmetric, peaked in the center, and tapering off equally on both sides. Many natural measurements (heights, test scores) follow approximately bell-shaped distributions.

AR المنحنى الجرسي

الاسم غير الرسمي للتوزيع الطبيعي، الذي يشبه رسمه البياني شكل الجرس — متماثل، يبلغ ذروته في المنتصف، ويتناقص تدريجيًا على الجانبين. تتبع كثير من القياسات الطبيعية (الأطوال، ودرجات الاختبارات) توزيعات تقريبية تشبه الجرس.

ES Curva de campana

El nombre informal de la distribución normal, cuya gráfica se asemeja a una campana — simétrica, con pico en el centro y que decrece en ambos lados. Muchas medidas naturales (alturas, puntajes de exámenes) siguen distribuciones aproximadamente acampanadas.

EN Bias

A systematic error that causes a statistic to consistently overestimate or underestimate the true population parameter. Bias can arise from poor sampling methods, measurement errors, or flawed study design. Unlike random error, bias does not average out over repeated measurements.

AR التحيز

خطأ منهجي يجعل إحصائية ما تُبالغ في تقدير المعامل الحقيقي للمجتمع أو تُقلّله باستمرار. قد ينشأ التحيز من أساليب أخذ العينات السيئة أو أخطاء القياس أو قصور تصميم الدراسة. وخلافًا للخطأ العشوائي، لا يزول التحيز بالمعدل في القياسات المتكررة.

ES Sesgo

Un error sistemático que hace que un estadístico sobreestime o subestime consistentemente el parámetro poblacional verdadero. El sesgo puede surgir de métodos de muestreo deficientes, errores de medición o diseños de estudio defectuosos. A diferencia del error aleatorio, el sesgo no se cancela con mediciones repetidas.

EN Boxplot (Box-and-Whisker Plot)

A graph that displays the five-number summary of a dataset: minimum, Q1, median, Q3, and maximum. The box spans the IQR (middle 50% of data), while the whiskers extend to the data extremes. Outliers are shown as individual points beyond the whiskers.

AR المخطط الصندوقي

رسم بياني يعرض الملخص الخماسي لمجموعة بيانات: الحد الأدنى، والربع الأول، والوسيط، والربع الثالث، والحد الأقصى. يمتد الصندوق عبر المدى الربيعي (50% الوسطى من البيانات)، فيما تمتد الشوارب إلى الطرفين. وتُعرض القيم الشاذة كنقاط منفردة خارج الشوارب.

ES Diagrama de caja (Boxplot)

Un gráfico que muestra el resumen de cinco números de un conjunto de datos: mínimo, Q1, mediana, Q3 y máximo. La caja abarca el RIC (50% central de los datos) y los bigotes se extienden a los extremos. Los valores atípicos se muestran como puntos individuales fuera de los bigotes.

C

EN Central Limit Theorem (CLT)

One of the most important theorems in statistics: it states that the sampling distribution of the sample mean approaches a normal distribution as the sample size increases, regardless of the shape of the original population distribution. This is why normal-based inference works so broadly.

x̄ ~ N(μ, σ²/n) as n → ∞
AR نظرية الحد المركزي

إحدى أهم النظريات في الإحصاء: تنصّ على أن التوزيع العيّني لمتوسط العيّنة يقترب من التوزيع الطبيعي كلما زاد حجم العيّنة، بغضّ النظر عن شكل توزيع المجتمع الأصلي. وهذا ما يجعل الاستدلال القائم على التوزيع الطبيعي واسع الانتشار والتطبيق.

ES Teorema del límite central (TLC)

Uno de los teoremas más importantes de la estadística: afirma que la distribución muestral de la media muestral se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra, sin importar la forma de la distribución poblacional original. Por eso la inferencia basada en la normal funciona tan ampliamente.

EN Chi-Square Test (χ²)

A hypothesis test used to analyze categorical data — either to test goodness-of-fit (does observed data match an expected distribution?) or independence (are two categorical variables related?). The test statistic compares observed and expected frequencies.

χ² = Σ [(observed − expected)² / expected]
AR اختبار كاي تربيع (χ²)

اختبار فرضيات يُستخدم لتحليل البيانات الفئوية — إما لاختبار حسن المطابقة (هل تتوافق البيانات الملاحظة مع التوزيع المتوقع؟) أو الاستقلالية (هل ثمة علاقة بين متغيرين فئويين؟). تقارن إحصائية الاختبار بين التكرارات الملاحظة والمتوقعة.

ES Prueba chi-cuadrado (χ²)

Una prueba de hipótesis para analizar datos categóricos — ya sea para probar bondad de ajuste (¿los datos observados coinciden con una distribución esperada?) o independencia (¿dos variables categóricas están relacionadas?). El estadístico compara frecuencias observadas y esperadas.

EN Confidence Interval (CI)

A range of values calculated from sample data that is likely to contain the true population parameter with a specified level of confidence (commonly 95%). A 95% CI means that if we repeated the sampling process many times, about 95% of those intervals would capture the true parameter.

CI = x̄ ± z*(σ/√n)
AR فترة الثقة

نطاق من القيم يُحسب من بيانات العيّنة، ومن المرجح أن يحتوي على المعامل الحقيقي للمجتمع بمستوى ثقة محدد (95% في الغالب). تعني فترة الثقة 95% أنه لو كررنا عملية أخذ العيّنات مرات عديدة، فإن نحو 95% من تلك الفترات ستشمل المعامل الحقيقي.

ES Intervalo de confianza (IC)

Un rango de valores calculado a partir de datos muestrales que probablemente contiene el parámetro poblacional verdadero con un nivel de confianza especificado (comúnmente 95%). Un IC del 95% significa que si repitiéramos el muestreo muchas veces, alrededor del 95% de esos intervalos capturarían el parámetro verdadero.

EN Correlation

A statistical measure (r) that describes the strength and direction of the linear relationship between two quantitative variables. Values range from −1 (perfect negative) to +1 (perfect positive), with 0 indicating no linear relationship. Correlation does not imply causation.

r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / [(n−1)sₓsᵧ]
AR الارتباط

مقياس إحصائي (r) يصف قوة واتجاه العلاقة الخطية بين متغيرين كميين. تتراوح القيم بين −1 (ارتباط سلبي تام) و+1 (ارتباط إيجابي تام)، وتشير القيمة 0 إلى غياب علاقة خطية. لا يعني الارتباط بالضرورة وجود علاقة سببية.

ES Correlación

Una medida estadística (r) que describe la fuerza y dirección de la relación lineal entre dos variables cuantitativas. Los valores van de −1 (negativa perfecta) a +1 (positiva perfecta), con 0 indicando ninguna relación lineal. La correlación no implica causalidad.

D

EN Data

Collected facts, measurements, or observations used for analysis. Data can be quantitative (numerical) or qualitative (categorical). The quality and representativeness of data are crucial to drawing valid statistical conclusions.

AR البيانات

حقائق أو قياسات أو ملاحظات مجمّعة تُستخدم في التحليل. يمكن أن تكون البيانات كمية (رقمية) أو نوعية (فئوية). تُعدّ جودة البيانات وتمثيلها للمجتمع المدروس أمرًا بالغ الأهمية للتوصل إلى استنتاجات إحصائية صحيحة.

ES Datos

Hechos, mediciones u observaciones recopilados para análisis. Los datos pueden ser cuantitativos (numéricos) o cualitativos (categóricos). La calidad y representatividad de los datos son cruciales para extraer conclusiones estadísticas válidas.

EN Degrees of Freedom (df)

The number of independent pieces of information available to estimate a parameter. In most tests, df = n − 1 for a single sample. Degrees of freedom affect which t-distribution or chi-square distribution table value is used.

df = n − 1 (for one-sample t-test)
AR درجات الحرية

عدد القطع المستقلة من المعلومات المتاحة لتقدير معامل ما. في معظم الاختبارات، df = n − 1 لعيّنة واحدة. تؤثر درجات الحرية في تحديد القيمة المجدولة المناسبة من توزيع t أو توزيع كاي تربيع.

ES Grados de libertad (gl)

El número de piezas de información independientes disponibles para estimar un parámetro. En la mayoría de las pruebas, gl = n − 1 para una sola muestra. Los grados de libertad determinan qué valor de la tabla de distribución t o chi-cuadrado se usa.

EN Distribution

A description or function showing all possible values a variable can take and how frequently each value occurs. Common distributions include normal, binomial, Poisson, and uniform. The shape of a distribution reveals important properties of the data.

AR التوزيع

وصف أو دالة تُبيّن جميع القيم الممكنة التي يمكن أن يأخذها متغير ما ومعدل تكرار كل قيمة. تشمل التوزيعات الشائعة: الطبيعي، والثنائي، وبواسون، والمنتظم. يكشف شكل التوزيع عن خصائص مهمة في البيانات.

ES Distribución

Una descripción o función que muestra todos los valores posibles de una variable y con qué frecuencia ocurre cada uno. Las distribuciones comunes incluyen la normal, binomial, Poisson y uniforme. La forma de una distribución revela propiedades importantes de los datos.

E

EN Effect Size

A standardized measure of the practical magnitude of an effect, independent of sample size. Common measures include Cohen's d (for comparing means) and r (for correlation). Effect size answers "how big?" while p-value answers "is it real?"

Cohen's d = (μ₁ − μ₂) / σ_pooled
AR حجم التأثير

مقياس موحّد للحجم العملي لتأثير ما، بمعزل عن حجم العيّنة. تشمل المقاييس الشائعة: d لكوهين (لمقارنة المتوسطات) و r (للارتباط). يُجيب حجم التأثير على سؤال "كم يبلغ الحجم؟"، في حين تُجيب القيمة الاحتمالية على سؤال "هل التأثير حقيقي؟"

ES Tamaño del efecto

Una medida estandarizada de la magnitud práctica de un efecto, independiente del tamaño de la muestra. Las medidas comunes incluyen la d de Cohen (para comparar medias) y r (para correlación). El tamaño del efecto responde "¿qué tan grande?" mientras que el valor p responde "¿es real?"

F

EN Frequency

The count of how many times a particular value or category appears in a dataset. Relative frequency expresses this count as a proportion or percentage of the total. Frequency distributions organize data to show these counts across all values or intervals.

AR التكرار

عدد المرات التي تظهر فيها قيمة أو فئة معينة في مجموعة بيانات. يُعبّر التكرار النسبي عن هذا العدد كنسبة مئوية من الإجمالي. تُنظّم توزيعات التكرار البيانات لعرض هذه الأعداد عبر جميع القيم أو الفترات.

ES Frecuencia

El conteo de cuántas veces aparece un valor o categoría particular en un conjunto de datos. La frecuencia relativa expresa este conteo como proporción o porcentaje del total. Las distribuciones de frecuencia organizan los datos para mostrar estos conteos en todos los valores o intervalos.

H

EN Histogram

A bar graph for quantitative data where the horizontal axis represents intervals (bins) of values, and the height of each bar shows the frequency of data in that interval. Unlike a bar chart, there are no gaps between bars, and it displays the shape, center, and spread of numerical distributions.

AR المدرج التكراري

رسم بياني بالأعمدة للبيانات الكمية، حيث تمثل المحور الأفقي فترات (فئات) من القيم، ويُبيّن ارتفاع كل عمود تكرار البيانات في تلك الفترة. وخلافًا لمخطط الأعمدة العادي، لا توجد فجوات بين الأعمدة، ويعرض شكل التوزيع العددي ومركزه وانتشاره.

ES Histograma

Un gráfico de barras para datos cuantitativos donde el eje horizontal representa intervalos (clases) de valores y la altura de cada barra muestra la frecuencia de datos en ese intervalo. A diferencia de un gráfico de barras, no hay espacios entre barras y muestra la forma, centro y dispersión de distribuciones numéricas.

EN Hypothesis

A testable statement or claim about a population parameter. In statistical testing, we always have two competing hypotheses: the null hypothesis (H₀) and the alternative hypothesis (H₁). Data are collected and analyzed to decide which hypothesis is better supported.

AR الفرضية

عبارة أو ادعاء قابل للاختبار حول معامل مجتمع إحصائي. في الاختبار الإحصائي، يكون هناك دائمًا فرضيتان متنافستان: الفرضية الصفرية (H₀) والفرضية البديلة (H₁). تُجمع البيانات وتُحلَّل للبتّ في أي الفرضيتين مدعومة بشكل أفضل.

ES Hipótesis

Una afirmación comprobable sobre un parámetro poblacional. En las pruebas estadísticas, siempre hay dos hipótesis en competencia: la hipótesis nula (H₀) y la hipótesis alternativa (H₁). Se recopilan y analizan datos para decidir cuál hipótesis está mejor respaldada.

I

EN Independent Variable

The variable that is manipulated, controlled, or used to predict the outcome in a study. In regression, the independent variable (also called the predictor or explanatory variable) is placed on the x-axis. Changes in the independent variable are used to explain changes in the dependent variable.

AR المتغير المستقل

المتغير الذي يُتحكّم فيه أو يُعدَّل أو يُستخدم للتنبؤ بالنتيجة في الدراسة. في الانحدار، يُوضع المتغير المستقل (ويُسمى أيضًا المتغير المُنبئ أو التفسيري) على المحور السيني. تُستخدم التغيرات في المتغير المستقل لتفسير التغيرات في المتغير التابع.

ES Variable independiente

La variable que se manipula, controla o usa para predecir el resultado en un estudio. En regresión, la variable independiente (también llamada predictora o explicativa) se coloca en el eje x. Los cambios en la variable independiente se usan para explicar cambios en la variable dependiente.

EN Inferential Statistics

The branch of statistics that uses sample data to make conclusions (inferences) about a larger population. It includes hypothesis testing, confidence intervals, and regression analysis. Inferential statistics always involves some degree of uncertainty because we are generalizing from a sample.

AR الإحصاء الاستنتاجي

فرع الإحصاء الذي يستخدم بيانات العيّنة لاستخلاص استنتاجات حول مجتمع أكبر. يشمل اختبار الفرضيات، وفترات الثقة، وتحليل الانحدار. ينطوي الإحصاء الاستنتاجي دائمًا على قدر من عدم اليقين لأننا نُعمّم من عيّنة.

ES Estadística inferencial

La rama de la estadística que usa datos muestrales para hacer conclusiones sobre una población más grande. Incluye pruebas de hipótesis, intervalos de confianza y análisis de regresión. La estadística inferencial siempre involucra cierto grado de incertidumbre porque generalizamos a partir de una muestra.

EN Interquartile Range (IQR)

The range of the middle 50% of the data, calculated as Q3 − Q1. The IQR is a resistant measure of spread because it is not affected by extreme values or outliers. It is used in the boxplot and in outlier detection rules.

IQR = Q3 − Q1
AR المدى الربيعي (IQR)

مدى 50% الوسطى من البيانات، ويُحسب بطرح Q1 من Q3. يُعدّ المدى الربيعي مقياسًا مقاومًا للانتشار لأنه لا يتأثر بالقيم المتطرفة أو الشاذة. يُستخدم في المخطط الصندوقي وقواعد اكتشاف القيم الشاذة.

ES Rango intercuartílico (RIC)

El rango del 50% central de los datos, calculado como Q3 − Q1. El RIC es una medida de dispersión resistente porque no se ve afectada por valores extremos ni atípicos. Se usa en el diagrama de caja y en las reglas de detección de valores atípicos.

M

EN Mean

The arithmetic average of a dataset, calculated by summing all values and dividing by the count. The mean is sensitive to outliers and is most useful when data are symmetric and without extreme values. It is the most commonly used measure of center.

x̄ = (x₁ + x₂ + ... + xₙ) / n
AR المتوسط الحسابي

المتوسط الحسابي لمجموعة بيانات، يُحسب بجمع جميع القيم وقسمتها على عددها. المتوسط حساس للقيم الشاذة، وهو أكثر فائدة عندما تكون البيانات متماثلة وخالية من القيم المتطرفة. وهو المقياس الأكثر شيوعًا لقياس المركز.

ES Media

El promedio aritmético de un conjunto de datos, calculado sumando todos los valores y dividiendo entre el conteo. La media es sensible a los valores atípicos y es más útil cuando los datos son simétricos y sin valores extremos. Es la medida de centro más común.

EN Median

The middle value of a dataset when all values are arranged in order. If there is an even number of values, the median is the average of the two middle values. The median is resistant to outliers, making it a better measure of center for skewed distributions.

AR الوسيط

القيمة الوسطى في مجموعة بيانات بعد ترتيب جميع القيم تصاعديًا. إذا كان عدد القيم زوجيًا، يكون الوسيط متوسط القيمتين الوسطيين. الوسيط مقاوم للقيم الشاذة، مما يجعله مقياسًا أفضل للمركز في التوزيعات الملتوية.

ES Mediana

El valor central de un conjunto de datos cuando todos los valores se ordenan. Si hay un número par de valores, la mediana es el promedio de los dos del centro. La mediana es resistente a los valores atípicos, lo que la hace una mejor medida de centro para distribuciones asimétricas.

EN Mode

The value (or values) that appears most frequently in a dataset. A dataset can have one mode (unimodal), two modes (bimodal), or more (multimodal). The mode is the only measure of center that can be used with nominal (categorical) data.

AR المنوال

القيمة (أو القيم) التي تظهر بأعلى تكرار في مجموعة بيانات. قد يكون لمجموعة البيانات منوال واحد (أحادي المنوال)، أو منوالان (ثنائي المنوال)، أو أكثر (متعدد المنوال). يُعدّ المنوال المقياس الوحيد للمركز الذي يمكن استخدامه مع البيانات الاسمية (الفئوية).

ES Moda

El valor (o valores) que aparece con mayor frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda (unimodal), dos modas (bimodal) o más (multimodal). La moda es la única medida de centro que se puede usar con datos nominales (categóricos).

N

EN Normal Distribution

A symmetric, bell-shaped probability distribution fully described by its mean (μ) and standard deviation (σ). About 68% of data falls within 1σ of the mean, 95% within 2σ, and 99.7% within 3σ (the empirical rule). It is the foundation of much classical statistics.

68-95-99.7 Rule: μ ± 1σ, μ ± 2σ, μ ± 3σ
AR التوزيع الطبيعي

توزيع احتمالي متماثل على شكل جرس، يتحدد بالكامل بمتوسطه (μ) وانحرافه المعياري (σ). تقع نحو 68% من البيانات ضمن نطاق σ1 من المتوسط، و95% ضمن σ2، و99.7% ضمن σ3 (القاعدة التجريبية). وهو حجر الزاوية لكثير من الإحصاء الكلاسيكي.

ES Distribución normal

Una distribución de probabilidad simétrica en forma de campana, completamente descrita por su media (μ) y desviación estándar (σ). Alrededor del 68% de los datos cae dentro de 1σ de la media, el 95% dentro de 2σ, y el 99.7% dentro de 3σ (regla empírica). Es la base de gran parte de la estadística clásica.

EN Null Hypothesis (H₀)

The default assumption in hypothesis testing — typically a statement of "no effect," "no difference," or "no relationship." We assume H₀ is true and collect evidence to try to reject it. We never "accept" H₀; we either reject it or fail to reject it.

AR الفرضية الصفرية (H₀)

الافتراض الابتدائي في اختبار الفرضيات — وهو في الغالب عبارة تنصّ على "لا تأثير" أو "لا فرق" أو "لا علاقة". نفترض صحة H₀ ونجمع الأدلة لمحاولة رفضها. لا نقبل H₀ أبدًا؛ بل إما أن نرفضها أو نفشل في رفضها.

ES Hipótesis nula (H₀)

El supuesto predeterminado en las pruebas de hipótesis — normalmente una afirmación de "sin efecto", "sin diferencia" o "sin relación". Suponemos que H₀ es verdadera y recopilamos evidencia para intentar rechazarla. Nunca "aceptamos" H₀; o la rechazamos o no la rechazamos.

O

EN Outlier

A data point that lies far from most of the other values in the dataset. Outliers can result from measurement errors, data entry mistakes, or genuinely unusual observations. They can strongly influence the mean and standard deviation, and must be investigated carefully before removal.

Outlier if: x < Q1 − 1.5×IQR or x > Q3 + 1.5×IQR
AR القيمة الشاذة

نقطة بيانات تقع بعيدًا عن سائر القيم في مجموعة البيانات. قد تنشأ القيم الشاذة عن أخطاء في القياس، أو أخطاء إدخال البيانات، أو ملاحظات غير اعتيادية حقيقية. يمكنها أن تؤثر تأثيرًا بالغًا في المتوسط والانحراف المعياري، وينبغي دراستها بعناية قبل حذفها.

ES Valor atípico (Outlier)

Un punto de datos que se encuentra lejos de la mayoría de los demás valores del conjunto. Los valores atípicos pueden surgir de errores de medición, errores de entrada de datos u observaciones genuinamente inusuales. Pueden influir fuertemente en la media y la desviación estándar, y deben investigarse cuidadosamente antes de eliminarlos.

P

EN p-value

The probability of obtaining a test statistic at least as extreme as the observed one, assuming the null hypothesis is true. A small p-value (typically < 0.05) provides evidence against H₀. The p-value does NOT tell us the probability that H₀ is true.

AR القيمة الاحتمالية (p-value)

احتمال الحصول على إحصائية اختبار مساوية أو أشد تطرفًا من الإحصائية الملاحظة، بافتراض صحة الفرضية الصفرية. تُشكّل قيمة p الصغيرة (أقل من 0.05 عادةً) دليلًا ضد H₀. لا تُخبرنا قيمة p باحتمال صحة H₀.

ES Valor p

La probabilidad de obtener un estadístico de prueba al menos tan extremo como el observado, asumiendo que la hipótesis nula es verdadera. Un valor p pequeño (típicamente < 0.05) proporciona evidencia contra H₀. El valor p NO dice la probabilidad de que H₀ sea verdadera.

EN Parameter

A numerical value that describes a characteristic of the entire population, such as the population mean (μ) or population standard deviation (σ). Parameters are usually unknown and are estimated using statistics computed from samples.

AR المعامل

قيمة عددية تصف خصائص المجتمع بأكمله، كمتوسط المجتمع (μ) أو انحرافه المعياري (σ). عادةً ما تكون المعاملات مجهولة، ويُقدَّر قيمتها باستخدام إحصائيات محسوبة من العيّنات.

ES Parámetro

Un valor numérico que describe una característica de toda la población, como la media poblacional (μ) o la desviación estándar poblacional (σ). Los parámetros suelen ser desconocidos y se estiman usando estadísticos calculados a partir de muestras.

EN Population

The complete set of all individuals, items, or measurements of interest in a study. Because studying an entire population is usually impractical, statisticians work with samples drawn from the population and use inferential statistics to draw conclusions.

AR المجتمع الإحصائي

المجموعة الكاملة لجميع الأفراد أو العناصر أو القياسات موضع الاهتمام في الدراسة. لأن دراسة المجتمع بأكمله في الغالب أمر غير عملي، يعمل الإحصائيون مع عيّنات مأخوذة من المجتمع ويستخدمون الإحصاء الاستنتاجي لاستخلاص النتائج.

ES Población

El conjunto completo de todos los individuos, elementos o mediciones de interés en un estudio. Como estudiar toda una población suele ser impracticable, los estadísticos trabajan con muestras de la población y usan estadística inferencial para extraer conclusiones.

EN Probability

A number between 0 and 1 (or 0% and 100%) expressing the likelihood of an event occurring. A probability of 0 means the event is impossible; 1 means it is certain. Probability forms the mathematical foundation underlying all of inferential statistics.

P(event) = favorable outcomes / total outcomes
AR الاحتمال

عدد يتراوح بين 0 و1 (أو 0% و100%) يُعبّر عن مدى احتمال وقوع حدث ما. يعني الاحتمال 0 أن الحدث مستحيل، فيما يعني الاحتمال 1 أنه حتمي. يُشكّل الاحتمال الأساس الرياضي الذي يقوم عليه الإحصاء الاستنتاجي بأسره.

ES Probabilidad

Un número entre 0 y 1 (o 0% y 100%) que expresa la probabilidad de que ocurra un evento. Una probabilidad de 0 significa que el evento es imposible; 1 significa que es seguro. La probabilidad es la base matemática que subyace a toda la estadística inferencial.

Q

EN Quartile

Values that divide a dataset into four equal parts. Q1 (25th percentile) is the value below which 25% of data falls; Q2 (50th percentile) is the median; Q3 (75th percentile) has 75% of data below it. Quartiles are used to compute the IQR and boxplots.

AR الربيع

قيم تقسّم مجموعة البيانات إلى أربعة أجزاء متساوية. Q1 (الرتبة المئينية 25) هي القيمة التي تقع دونها 25% من البيانات؛ وQ2 (الرتبة المئينية 50) هو الوسيط؛ وQ3 (الرتبة المئينية 75) تقع دونه 75% من البيانات. تُستخدم الأرباع لحساب المدى الربيعي والمخططات الصندوقية.

ES Cuartil

Valores que dividen un conjunto de datos en cuatro partes iguales. Q1 (percentil 25) es el valor por debajo del cual cae el 25% de los datos; Q2 (percentil 50) es la mediana; Q3 (percentil 75) tiene el 75% de los datos por debajo. Los cuartiles se usan para calcular el RIC y los diagramas de caja.

R

EN Random Sample

A sample in which every individual in the population has an equal and independent chance of being selected. Random sampling is the gold standard in statistics because it helps ensure the sample is representative of the population, reducing bias.

AR العينة العشوائية

عيّنة تكون فيها لكل فرد في المجتمع فرصة متساوية ومستقلة لاختياره. تُعدّ العيّنة العشوائية المعيار الذهبي في الإحصاء لأنها تساعد على ضمان تمثيل العيّنة للمجتمع، مما يقلل التحيز.

ES Muestra aleatoria

Una muestra en la que cada individuo de la población tiene una probabilidad igual e independiente de ser seleccionado. El muestreo aleatorio es el estándar de oro en estadística porque ayuda a garantizar que la muestra sea representativa de la población, reduciendo el sesgo.

EN Regression

A statistical method for modeling the relationship between a dependent (response) variable and one or more independent (predictor) variables. Simple linear regression fits a straight line through the data; multiple regression uses more than one predictor.

ŷ = b₀ + b₁x (simple linear regression)
AR الانحدار

أسلوب إحصائي لنمذجة العلاقة بين متغير تابع (استجابي) ومتغير مستقل واحد أو أكثر (منبئ). يُلائم الانحدار الخطي البسيط خطًا مستقيمًا عبر البيانات؛ أما الانحدار المتعدد فيستخدم أكثر من متغير منبئ.

ES Regresión

Un método estadístico para modelar la relación entre una variable dependiente (respuesta) y una o más variables independientes (predictoras). La regresión lineal simple ajusta una línea recta a los datos; la regresión múltiple usa más de un predictor.

S

EN Sample

A subset of individuals selected from the population for study. Because samples are smaller than the full population, they are practical to collect and analyze. The goal is to choose a sample that accurately represents the population so that results can be generalized.

AR العينة

مجموعة فرعية من الأفراد تُختار من المجتمع للدراسة. لأن العيّنات أصغر من المجتمع الكامل، فهي عملية في الجمع والتحليل. الهدف هو اختيار عيّنة تمثّل المجتمع بدقة بحيث يمكن تعميم النتائج.

ES Muestra

Un subconjunto de individuos seleccionados de la población para estudio. Como las muestras son más pequeñas que la población completa, son prácticas de recopilar y analizar. El objetivo es elegir una muestra que represente con precisión a la población para poder generalizar los resultados.

EN Significance Level (α)

The threshold probability for rejecting the null hypothesis, set before the test is conducted. The most common value is α = 0.05. If p-value < α, we reject H₀. The significance level directly controls the probability of making a Type I error.

AR مستوى الدلالة (α)

عتبة الاحتمال لرفض الفرضية الصفرية، يُحدَّد قبل إجراء الاختبار. القيمة الأكثر شيوعًا هي α = 0.05. إذا كانت قيمة p أصغر من α، نرفض H₀. يتحكم مستوى الدلالة مباشرةً في احتمال ارتكاب خطأ من النوع الأول.

ES Nivel de significancia (α)

La probabilidad umbral para rechazar la hipótesis nula, establecida antes de realizar la prueba. El valor más común es α = 0.05. Si el valor p < α, rechazamos H₀. El nivel de significancia controla directamente la probabilidad de cometer un Error tipo I.

EN Skewness

A measure of the asymmetry of a distribution. A right-skewed (positively skewed) distribution has a long tail to the right; a left-skewed distribution has a long tail to the left. In skewed distributions, the mean is pulled toward the tail, away from the median.

AR الالتواء

مقياس لعدم تماثل التوزيع. يمتلك التوزيع الملتوي يمينًا (الالتواء الموجب) ذيلًا طويلًا نحو اليمين؛ أما التوزيع الملتوي يسارًا فله ذيل طويل نحو اليسار. في التوزيعات الملتوية، يُسحب المتوسط نحو الذيل، بعيدًا عن الوسيط.

ES Asimetría

Una medida de la asimetría de una distribución. Una distribución sesgada a la derecha (positivamente sesgada) tiene una cola larga a la derecha; una sesgada a la izquierda tiene una cola larga a la izquierda. En distribuciones asimétricas, la media se aleja de la mediana hacia la cola.

EN Standard Deviation

A measure of how spread out values are around the mean, expressed in the same units as the data. A small standard deviation means values cluster tightly around the mean; a large one means they are spread widely. It is the square root of the variance.

s = √[Σ(xᵢ − x̄)² / (n−1)]
AR الانحراف المعياري

مقياس لمدى تشتت القيم حول المتوسط، معبَّرٌ عنه بالوحدات نفسها للبيانات. انحراف معياري صغير يعني أن القيم تتجمع بإحكام حول المتوسط؛ أما الكبير فيعني أنها منتشرة على نطاق واسع. وهو الجذر التربيعي للتباين.

ES Desviación estándar

Una medida de cuán dispersos están los valores alrededor de la media, expresada en las mismas unidades que los datos. Una desviación estándar pequeña significa que los valores se agrupan cerca de la media; una grande significa que están muy dispersos. Es la raíz cuadrada de la varianza.

EN Standard Error (SE)

The standard deviation of the sampling distribution of a statistic (most commonly the sample mean). It measures how much the sample mean is expected to vary from one sample to another. A smaller SE indicates more precise estimates.

SE = s / √n
AR الخطأ المعياري

الانحراف المعياري للتوزيع العيّني لإحصائية ما (وأشهرها متوسط العيّنة). يقيس مقدار التفاوت المتوقع لمتوسط العيّنة بين عيّنة وأخرى. يشير الخطأ المعياري الأصغر إلى تقديرات أكثر دقة.

ES Error estándar (EE)

La desviación estándar de la distribución muestral de un estadístico (más comúnmente la media muestral). Mide cuánto se espera que varíe la media muestral de una muestra a otra. Un EE más pequeño indica estimaciones más precisas.

EN Statistic

A numerical value computed from sample data, used to estimate a population parameter. Common statistics include the sample mean (x̄), sample standard deviation (s), and sample proportion (p̂). Statistics vary from sample to sample, which is why we need inferential methods.

AR الإحصائية

قيمة عددية تُحسب من بيانات العيّنة، وتُستخدم لتقدير معامل المجتمع. تشمل الإحصائيات الشائعة: متوسط العيّنة (x̄)، والانحراف المعياري للعيّنة (s)، ونسبة العيّنة (p̂). تتفاوت الإحصائيات من عيّنة إلى أخرى، وهذا ما يستلزم الأساليب الاستنتاجية.

ES Estadístico

Un valor numérico calculado a partir de datos muestrales, usado para estimar un parámetro poblacional. Los estadísticos comunes incluyen la media muestral (x̄), la desviación estándar muestral (s) y la proporción muestral (p̂). Los estadísticos varían de muestra en muestra, por eso necesitamos métodos inferenciales.

T

EN t-test

A hypothesis test used to compare means when the population standard deviation is unknown and the sample size is small. There are one-sample, two-sample (independent), and paired t-tests. The t-test uses the t-distribution, which has heavier tails than the normal distribution.

t = (x̄ − μ₀) / (s / √n)
AR اختبار-t

اختبار فرضيات يُستخدم لمقارنة المتوسطات عندما يكون الانحراف المعياري للمجتمع مجهولًا وحجم العيّنة صغيرًا. تشمل أنواعه: اختبار العيّنة الواحدة، والعيّنتين المستقلتين، والعيّنات المترافقة. يستخدم اختبار-t توزيع t ذا الأذناب الأثقل مقارنةً بالتوزيع الطبيعي.

ES Prueba t

Una prueba de hipótesis para comparar medias cuando la desviación estándar poblacional es desconocida y el tamaño de muestra es pequeño. Hay pruebas t de una muestra, dos muestras (independientes) y pareadas. La prueba t usa la distribución t, que tiene colas más pesadas que la normal.

EN Type I Error

Rejecting the null hypothesis when it is actually true — a "false positive." The probability of making a Type I error equals the significance level α. Reducing α lowers the chance of a Type I error but increases the chance of a Type II error.

AR خطأ من النوع الأول

رفض الفرضية الصفرية رغم صحتها فعلًا — وهو ما يُعرف بـ"الإيجابي الزائف". يساوي احتمال ارتكاب خطأ من النوع الأول مستوى الدلالة α. تقليل α يُخفّض احتمال خطأ النوع الأول لكنه يزيد من احتمال خطأ النوع الثاني.

ES Error tipo I

Rechazar la hipótesis nula cuando en realidad es verdadera — un "falso positivo". La probabilidad de cometer un Error tipo I es igual al nivel de significancia α. Reducir α disminuye la probabilidad del Error tipo I pero aumenta la del Error tipo II.

EN Type II Error

Failing to reject the null hypothesis when it is actually false — a "false negative." The probability of making a Type II error is denoted β. The power of a test (1 − β) is the probability of correctly rejecting a false null hypothesis.

AR خطأ من النوع الثاني

عدم رفض الفرضية الصفرية رغم أنها خاطئة فعلًا — وهو ما يُعرف بـ"السلبي الزائف". يُرمز إلى احتمال ارتكاب خطأ من النوع الثاني بـ β. قوة الاختبار (1 − β) هي احتمال رفض الفرضية الصفرية الخاطئة رفضًا صحيحًا.

ES Error tipo II

No rechazar la hipótesis nula cuando en realidad es falsa — un "falso negativo". La probabilidad de cometer un Error tipo II se denota β. La potencia de una prueba (1 − β) es la probabilidad de rechazar correctamente una hipótesis nula falsa.

V

EN Variance

The average of the squared differences from the mean. Variance measures how spread out data values are from the mean, but in squared units. Taking the square root of variance gives the standard deviation, which is in the original units of the data.

s² = Σ(xᵢ − x̄)² / (n−1)
AR التباين

متوسط مربعات الفروق عن المتوسط. يقيس التباين مدى تشتت قيم البيانات عن المتوسط، لكن بوحدات مربّعة. استخراج الجذر التربيعي للتباين يُعطينا الانحراف المعياري بالوحدات الأصلية للبيانات.

ES Varianza

El promedio de las diferencias al cuadrado respecto a la media. La varianza mide cuán dispersos están los valores de los datos desde la media, pero en unidades al cuadrado. La raíz cuadrada de la varianza da la desviación estándar, en las unidades originales de los datos.

Z

EN z-score

A standardized value that tells how many standard deviations an observation is above or below the mean. A z-score of 0 means the value equals the mean; a z-score of +2 means it is 2 standard deviations above the mean. Z-scores allow comparison across different scales.

z = (x − μ) / σ
AR الدرجة المعيارية (z-score)

قيمة موحّدة تُخبر بعدد الانحرافات المعيارية التي تعلو أو تقل عنها الملاحظة عن المتوسط. تعني الدرجة المعيارية 0 أن القيمة تساوي المتوسط؛ وتعني الدرجة +2 أنها تعلو المتوسط بانحرافين معياريين. تُتيح الدرجات المعيارية المقارنة عبر مقاييس مختلفة.

ES Puntuación z

Un valor estandarizado que indica cuántas desviaciones estándar está una observación por encima o por debajo de la media. Una puntuación z de 0 significa que el valor iguala la media; una de +2 significa que está 2 desviaciones estándar por encima. Las puntuaciones z permiten comparar entre diferentes escalas.