Version 0.14

7 de agosto de 2013

Registro de cambios

Resumen de cambios en la API

  • La función auc_score ha pasado a llamarse roc_auc_score.

  • Realizar pruebas scikit-learn con sklearn.test() está obsoleto. Utiliza nosetests sklearn desde la línea de comandos.

  • La importancia de las características en tree.DecisionTreeClassifier, tree.DecisionTreeRegressor y todos los estimadores de conjuntos derivados se calculan ahora sobre la marcha cuando se accede al atributo feature_importances_. Ya no es necesario establecer compute_importances=True. Por Gilles Louppe.

  • linear_model.lasso_path y linear_model.enet_path pueden devolver sus resultados en el mismo formato que el de linear_model.lars_path. Esto se hace estableciendo el parámetro return_models a False. Por Jaques Grobler y Alexandre Gramfort

  • grid_search.IterGrid fue renombrado a grid_search.ParameterGrid.

  • Se ha corregido un error en KFold que provocaba un equilibrio imperfecto de las clases en algunos casos. Por Alexandre Gramfort y Tadej Janež.

  • Se ha refactorizado sklearn.neighbors.BallTree y se ha añadido una sklearn.neighbors.KDTree que comparte la misma interfaz. El Ball Tree ahora funciona con una amplia variedad de métricas de distancia. Ambas clases tienen muchos métodos nuevos, entre los que se incluyen las consultas de árbol único y de árbol doble, las búsquedas de amplitud y profundidad, y las consultas más avanzadas, como la estimación de la densidad del núcleo y las funciones de correlación de 2 puntos. Por Jake Vanderplas

  • Se ha eliminado el soporte para scipy.spatial.cKDTree dentro de las consultas de vecinos, y se ha sustituido la funcionalidad por la nueva clase KDTree.

  • Se ha añadido sklearn.neighbors.KernelDensity, que realiza una estimación eficiente de la densidad del núcleo con una variedad de núcleos.

  • sklearn.decomposition.KernelPCA ahora siempre devuelve la salida con n_components, a menos que el nuevo parámetro remove_zero_eig se establezca en True. Este nuevo comportamiento es consistente con la forma en que el núcleo PCA siempre fue documentado; anteriormente, la eliminación de componentes con valores propios cero se realizaba tácitamente en todos los datos.

  • gcv_mode="auto" ya no intenta realizar la SVD en una matriz dispersa densificada en sklearn.linear_model.RidgeCV.

  • El soporte de matrices dispersas en sklearn.decomposition.RandomizedPCA está ahora obsoleto en favor del nuevo TruncatedSVD.

  • cross_validation.KFold y cross_validation.StratifiedKFold ahora exigen que n_folds >= 2 de lo contrario se produce un ValueError. Por Olivier Grisel.

  • Los parámetros charset y charset_errors de datasets.load_files fueron renombrados como encoding y decode_errors.

  • El atributo oob_score_ en sklearn.ensemble.GradientBoostingRegressor y sklearn.ensemble.GradientBoostingClassifier está obsoleto y ha sido sustituido por oob_improvement_.

  • Los atributos de OrthogonalMatchingPursuit han quedado obsoletos (copy_X, Gram, …) y precompute_gram ha pasado a llamarse precompute_for_consistency. Ver #2224.

  • sklearn.preprocessing.StandardScaler ahora convierte la entrada de enteros a flotantes, y lanza una advertencia. Anteriormente redondeaba para entradas de enteros densos.

  • sklearn.multiclass.OneVsRestClassifier tiene ahora un método decision_function. Esto devolverá la distancia de cada muestra desde el límite de decisión para cada clase, siempre que los estimadores subyacentes implementen el método decision_function. Por Kyle Kastner.

  • Mejor validación de entrada, advertencia sobre formas inesperadas para y.

Personas

Lista de colaboradores de la versión 0.14.1 por número de commits.

  • 277 Gilles Louppe

  • 245 Lars Buitinck

  • 187 Andreas Mueller

  • 124 Arnaud Joly

  • 112 Jaques Grobler

  • 109 Gael Varoquaux

  • 107 Olivier Grisel

  • 102 Noel Dawe

  • 99 Kemal Eren

  • 79 Joel Nothman

  • 75 Jake VanderPlas

  • 73 Nelle Varoquaux

  • 71 Vlad Niculae

  • 65 Peter Prettenhofer

  • 64 Alexandre Gramfort

  • 54 Mathieu Blondel

  • 38 Nicolas Trésegnie

  • 35 eustache

  • 27 Denis Engemann

  • 25 Yann N. Dauphin

  • 19 Justin Vincent

  • 17 Robert Layton

  • 15 Doug Coleman

  • 14 Michael Eickenberg

  • 13 Robert Marchman

  • 11 Fabian Pedregosa

  • 11 Philippe Gervais

  • 10 Jim Holmström

  • 10 Tadej Janež

  • 10 syhw

  • 9 Mikhail Korobov

  • 9 Steven De Gryze

  • 8 sergeyf

  • 7 Ben Root

  • 7 Hrishikesh Huilgolkar

  • 6 Kyle Kastner

  • 6 Martin Luessi

  • 6 Rob Speer

  • 5 Federico Vaggi

  • 5 Raul Garreta

  • 5 Rob Zinkov

  • 4 Ken Geis

  • 3 A. Flaxman

  • 3 Denton Cockburn

  • 3 Dougal Sutherland

  • 3 Ian Ozsvald

  • 3 Johannes Schönberger

  • 3 Robert McGibbon

  • 3 Roman Sinayev

  • 3 Szabo Roland

  • 2 Diego Molla

  • 2 Imran Haque

  • 2 Jochen Wersdörfer

  • 2 Sergey Karayev

  • 2 Yannick Schwartz

  • 2 jamestwebber

  • 1 Abhijeet Kolhe

  • 1 Alexander Fabisch

  • 1 Bastiaan van den Berg

  • 1 Benjamin Peterson

  • 1 Daniel Velkov

  • 1 Fazlul Shahriar

  • 1 Felix Brockherde

  • 1 Félix-Antoine Fortin

  • 1 Harikrishnan S

  • 1 Jack Hale

  • 1 JakeMick

  • 1 James McDermott

  • 1 John Benediktsson

  • 1 John Zwinck

  • 1 Joshua Vredevoogd

  • 1 Justin Pati

  • 1 Kevin Hughes

  • 1 Kyle Kelley

  • 1 Matthias Ekman

  • 1 Miroslav Shubernetskiy

  • 1 Naoki Orii

  • 1 Norbert Crombach

  • 1 Rafael Cunha de Almeida

  • 1 Rolando Espinoza La fuente

  • 1 Seamus Abshere

  • 1 Sergey Feldman

  • 1 Sergio Medina

  • 1 Stefano Lattarini

  • 1 Steve Koch

  • 1 Sturla Molden

  • 1 Thomas Jarosch

  • 1 Yaroslav Halchenko