sklearn.utils.check_array

sklearn.utils.check_array()

Validación de entrada en un arreglo, lista, matriz dispersa o similar.

Por defecto, se comprueba que la entrada es un arreglo 2D no vacío que contiene sólo valores finitos. Si el dtype del arreglo es un objeto, se intenta convertir a de punto flotante (float), y se produce un error.

Parámetros
arrayobjeto

Objeto de entrada a comprobar/convertir.

accept_sparsecadena, booleano o lista/tupla de cadena, default=False

Cadena[s] que representa los formatos de matriz dispersa permitidos, como “csc”, “csr”, etc. Si la entrada es dispersa pero no está en el formato permitido, se convertirá al primer formato de la lista. True permite que la entrada sea cualquier formato. False significa que una entrada de matriz dispersa dará lugar a un error.

accept_large_sparsebool, default=True

Si se suministra una matriz dispersa CSR, CSC, COO o BSR y se acepta mediante accept_sparse, accept_large_sparse=False hará que se acepte sólo si sus índices se almacenan con un dtype de 32 bits.

Nuevo en la versión 0.20.

dtype“numeric”, type, lista de tipos o None, default=”numeric”

Tipo de datos del resultado. Si es None, se conserva el dtype de la entrada. Si es «numérico», se preserva el tipo de datos a menos que array.dtype sea un objeto. Si dtype es una lista de tipos, la conversión en el primer tipo sólo se realiza si el dtype de la entrada no está en la lista.

order{“F”, “C”} o None, default=None

Si se forzara un arreglo al estilo fortran o c. Cuando la orden es None (predeterminado), entonces si copy=False, no se asegura nada sobre la disposición de memoria del arreglo de salida; en caso contrario (copy=True) la disposición de memoria del arreglo devuelto se mantiene lo más cerca posible del arreglo original.

copybooleano, default=False

Si se activará una copia forzada. Si copy=False, una copia podría ser desencadenada por una conversión.

force_all_finitebool o “allow-nan”, default=True

Si se debe lanzar un error sobre np.inf, np.nan, pd.NA en el arreglo. Las posibilidades son:

  • Verdadero: Fuerza que todos los valores del arreglo sean finitos.

  • False: acepta np.inf, np.nan, pd.NA en el arreglo.

  • allow-nan: sólo acepta valores np.nan y pd.NA en el arreglo. Los valores no pueden ser infinitos.

Nuevo en la versión 0.20: force_all_finite acepta la cadena 'allow-nan.

Distinto en la versión 0.23: Acepta pd.NA y lo convierte en np.nan

ensure_2dbool, default=True

Si se debe emitir un error de valor si el arreglo no es 2D.

allow_ndbooleano, default=False

Permitir o no el arreglo.ndim > 2.

ensure_min_samplesint, default=1

Asegúrate de que el arreglo tiene un número mínimo de muestras en su primer eje (filas para un arreglo 2D). El valor 0 desactiva esta comprobación.

ensure_min_featuresint, default=1

Asegúrate de que el arreglo 2D tiene un número mínimo de características (columnas). El valor predeterminado de 1 rechaza los conjuntos de datos vacíos. Esta comprobación sólo se aplica cuando los datos de entrada tienen efectivamente 2 dimensiones o son originalmente 1D y ensure_2d es True. El valor 0 desactiva esta comprobación.

estimatorstr o instancia del estimador, default=None

Si se pasa, incluye el nombre del estimador en los mensajes de advertencia.

Devuelve
array_convertedobjeto

El arreglo convertido y validado.