Qu'est-ce que le Boosting?

Boosting est un algorithme qui aide à réduire la variance et le biais dans un ensemble d'apprentissage automatique. Les algorithmes d'algorithmes (Algos) Les algorithmes (Algos) sont un ensemble d'instructions qui sont introduites pour effectuer une tâche.Des algorithmes sont introduits pour automatiser le trading afin de générer des profits à une fréquence impossible à un commerçant humain aide à la conversion des apprenants faibles en apprenants forts en combinant N nombre d'apprenants.

BoosterSource: Sirakorn [CC BY-SA]

La stimulation peut également améliorer les prédictions des modèles pour l'apprentissage des algorithmes. Les apprenants faibles sont corrigés séquentiellement par leurs prédécesseurs et, dans le processus, ils sont convertis en apprenants forts.

Formes de stimulation

Le boosting peut prendre plusieurs formes, notamment:

1. Boosting adaptatif (Adaboost)

Adaboost vise à combiner plusieurs apprenants faibles pour former un seul apprenant fort. Adaboost se concentre sur les apprenants faibles, qui sont souvent des arbres de décision avec une seule division et sont communément appelés souches de décision. Le premier moignon de décision dans Adaboost contient des observations qui sont pondérées de manière égale.

Les erreurs précédentes sont corrigées et toutes les observations qui ont été classées de manière incorrecte reçoivent plus de poids que les autres observations sans erreur de classification. Les algorithmes d'Adaboost sont couramment utilisés dans les procédures de régression et de classification. Une erreur constatée dans les modèles précédents est ajustée avec pondération jusqu'à ce qu'un prédicteur précis soit établi.

2. Amplification du dégradé

L'amplification de gradient, comme toute autre procédure d'apprentissage automatique d'ensemble, ajoute séquentiellement des prédicteurs à l'ensemble et suit la séquence de correction des prédicteurs précédents pour arriver à un prédicteur précis à la fin de la procédure. Adaboost corrige ses erreurs précédentes en ajustant les poids pour chaque observation incorrecte à chaque itération, mais l'augmentation de gradient vise à ajuster un nouveau prédicteur dans les erreurs résiduelles commises par le prédicteur précédent.

L'amplification de gradient utilise la descente de gradient pour identifier les défis dans les prédictions des apprenants utilisées précédemment. L'erreur précédente est mise en évidence et, en combinant un apprenant faible avec l'apprenant suivant, l'erreur est considérablement réduite au fil du temps.

3. XGBoost (amplification de gradient extrême)

XGBoostimg implémente des arbres de décision avec un gradient amélioré, des performances et une vitesse améliorées. La mise en œuvre des machines boostées par gradient est relativement lente, en raison de la formation du modèle qui doit suivre une séquence. Par conséquent, ils manquent d'évolutivité Évolutivité L'évolutivité peut tomber à la fois dans des contextes de stratégie financière et commerciale. Dans les deux cas, cela signifie la capacité de l'entité à résister à une pression due à sa lenteur.

XGBoost repose sur les performances d'un modèle et la vitesse de calcul. Il offre divers avantages, tels que la parallélisation, le calcul distribué, l'optimisation du cache et le calcul hors cœur.

XGBoost fournit la parallélisation dans la création d'arbres grâce à l'utilisation des cœurs de processeur pendant la formation. Il distribue également le calcul lors de la formation de grands modèles à l'aide de grappes de machines. L'informatique out-of-core est utilisée pour des ensembles de données plus volumineux qui ne peuvent pas tenir dans la taille de mémoire conventionnelle. L'optimisation du cache est également utilisée pour les algorithmes et les structures de données afin d'optimiser l'utilisation du matériel disponible.

Avantages et inconvénients du boosting

En tant que modèle d'ensemble, l'amplification est fournie avec un algorithme facile à lire et à interpréter, ce qui rend ses interprétations de prédiction faciles à gérer. La capacité de prédiction est efficace grâce à l'utilisation de ses méthodes de clonage, telles que le bagging Bagging (Bootstrap Aggregation) L'apprentissage automatique d'Ensemble peut être principalement catégorisé en ensachage et boosting. La technique d'ensachage est utile à la fois pour la régression et la forêt statistique ou aléatoire et les arbres de décision. Le boosting est une méthode résiliente qui limite facilement le sur-ajustement.

Un inconvénient du boosting est qu'il est sensible aux valeurs aberrantes puisque chaque classificateur est obligé de corriger les erreurs dans les prédécesseurs. Ainsi, la méthode est trop dépendante des valeurs aberrantes. Un autre inconvénient est que la méthode est presque impossible à mettre à l'échelle. En effet, chaque estimateur fonde son exactitude sur les prédicteurs précédents, ce qui rend la procédure difficile à rationaliser.

Que sont les arbres d'options?

Les arbres d'options sont les substituts aux arbres de décision. Ils représentent des classificateurs d'ensemble tout en dérivant une structure unique. La différence entre les arbres d'options et les arbres de décision est que le premier comprend à la fois les nœuds d'options et les nœuds de décision, tandis que le second inclut uniquement les nœuds de décision.

La classification d'une instance nécessite de la filtrer dans l'arborescence. Un nœud de décision est nécessaire pour choisir l'une des branches, tandis qu'un nœud d'option est nécessaire pour prendre le groupe entier de branches. Cela signifie qu'avec un nœud d'option, on se retrouve avec plusieurs feuilles qui nécessiteraient d'être combinées en une seule classification pour aboutir à une prédiction. Par conséquent, le vote est requis dans le processus, où un vote majoritaire signifie que le nœud a été sélectionné comme prédiction pour ce processus.

Le processus ci-dessus indique clairement que les nœuds d'options ne devraient pas être livrés avec deux options car ils finiront par perdre le vote s'ils ne peuvent pas trouver un gagnant définitif. L'autre possibilité consiste à prendre la moyenne des estimations de probabilité à partir de divers chemins en suivant des approches telles que l'approche bayésienne ou la méthode non pondérée des moyennes.

Les arborescences d'options peuvent également être développées à partir de la modification des apprenants d'arbres de décision existants ou de la création d'un nœud d'options où plusieurs divisions sont corrélées. Chaque arbre de décision dans un niveau de tolérance autorisé peut être converti en arbres d'options.

Plus de ressources

Finance est le fournisseur officiel de la certification Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ L'accréditation Certified Banking & Credit Analyst (CBCA) ™ est une norme mondiale pour les analystes de crédit qui couvre la finance, la comptabilité, l'analyse de crédit, modélisation d'alliances, remboursements de prêts, etc. programme de certification, conçu pour transformer n'importe qui en analyste financier de classe mondiale.

Pour continuer à apprendre et à développer vos connaissances en analyse financière, nous vous recommandons vivement les ressources financières supplémentaires ci-dessous:

  • Fintech (technologie financière) Fintech (technologie financière) Le terme fintech fait référence à la synergie entre la finance et la technologie, qui est utilisée pour améliorer les opérations commerciales et la fourniture de services financiers.
  • Finance quantitative Finance quantitative La finance quantitative est l'utilisation de modèles mathématiques et d'ensembles de données extrêmement volumineux pour analyser les marchés financiers et les titres. Des exemples courants comprennent (1) la tarification des titres dérivés tels que les options, et (2) la gestion des risques, en particulier en ce qui concerne la gestion de portefeuille.
  • Spoofing Spoofing Spoofing est une pratique de trading algorithmique perturbatrice qui consiste à placer des offres d'achat ou des offres de vente de contrats à terme et à annuler les offres ou les offres avant l'exécution de l'opération. La pratique vise à créer une fausse image de la demande ou un faux pessimisme sur le marché.
  • Guide des salaires des ingénieurs logiciels Guide des salaires des ingénieurs logiciels Dans ce guide des salaires des ingénieurs logiciels, nous couvrons plusieurs emplois d'ingénieur logiciel et leurs salaires intermédiaires correspondants pour 2018. Un ingénieur logiciel est un professionnel qui applique les principes du génie logiciel dans les processus de conception, de développement, de maintenance, test et évaluation des logiciels utilisés dans l'ordinateur

Recommandé

Restructuration de la Deutsche Bank
Qu'est-ce que l'Energy Risk Professional (ERP®)?
Qu'est-ce que la fonction FORECAST.LINEAR?