sklearn.utils
.check_array¶
- sklearn.utils.check_array()¶
Validación de entrada en un arreglo, lista, matriz dispersa o similar.
Por defecto, se comprueba que la entrada es un arreglo 2D no vacío que contiene sólo valores finitos. Si el dtype del arreglo es un objeto, se intenta convertir a de punto flotante (float), y se produce un error.
- Parámetros
- arrayobjeto
Objeto de entrada a comprobar/convertir.
- accept_sparsecadena, booleano o lista/tupla de cadena, default=False
Cadena[s] que representa los formatos de matriz dispersa permitidos, como “csc”, “csr”, etc. Si la entrada es dispersa pero no está en el formato permitido, se convertirá al primer formato de la lista. True permite que la entrada sea cualquier formato. False significa que una entrada de matriz dispersa dará lugar a un error.
- accept_large_sparsebool, default=True
Si se suministra una matriz dispersa CSR, CSC, COO o BSR y se acepta mediante accept_sparse, accept_large_sparse=False hará que se acepte sólo si sus índices se almacenan con un dtype de 32 bits.
Nuevo en la versión 0.20.
- dtype“numeric”, type, lista de tipos o None, default=”numeric”
Tipo de datos del resultado. Si es None, se conserva el dtype de la entrada. Si es «numérico», se preserva el tipo de datos a menos que array.dtype sea un objeto. Si dtype es una lista de tipos, la conversión en el primer tipo sólo se realiza si el dtype de la entrada no está en la lista.
- order{“F”, “C”} o None, default=None
Si se forzara un arreglo al estilo fortran o c. Cuando la orden es None (predeterminado), entonces si copy=False, no se asegura nada sobre la disposición de memoria del arreglo de salida; en caso contrario (copy=True) la disposición de memoria del arreglo devuelto se mantiene lo más cerca posible del arreglo original.
- copybooleano, default=False
Si se activará una copia forzada. Si copy=False, una copia podría ser desencadenada por una conversión.
- force_all_finitebool o “allow-nan”, default=True
Si se debe lanzar un error sobre np.inf, np.nan, pd.NA en el arreglo. Las posibilidades son:
Verdadero: Fuerza que todos los valores del arreglo sean finitos.
False: acepta np.inf, np.nan, pd.NA en el arreglo.
allow-nan
: sólo acepta valores np.nan y pd.NA en el arreglo. Los valores no pueden ser infinitos.
Nuevo en la versión 0.20:
force_all_finite
acepta la cadena'allow-nan
.Distinto en la versión 0.23: Acepta
pd.NA
y lo convierte ennp.nan
- ensure_2dbool, default=True
Si se debe emitir un error de valor si el arreglo no es 2D.
- allow_ndbooleano, default=False
Permitir o no el arreglo.ndim > 2.
- ensure_min_samplesint, default=1
Asegúrate de que el arreglo tiene un número mínimo de muestras en su primer eje (filas para un arreglo 2D). El valor 0 desactiva esta comprobación.
- ensure_min_featuresint, default=1
Asegúrate de que el arreglo 2D tiene un número mínimo de características (columnas). El valor predeterminado de 1 rechaza los conjuntos de datos vacíos. Esta comprobación sólo se aplica cuando los datos de entrada tienen efectivamente 2 dimensiones o son originalmente 1D y
ensure_2d
es True. El valor 0 desactiva esta comprobación.- estimatorstr o instancia del estimador, default=None
Si se pasa, incluye el nombre del estimador en los mensajes de advertencia.
- Devuelve
- array_convertedobjeto
El arreglo convertido y validado.