Si vous êtes dans le domaine de la technologie et recherchez un travail impliquant la science des données, vous avez probablement entendu parler du machine learning. Le terme donne un certain air mystérieux - beaucoup de gens sont déconcertés par le concept lui-même. Cependant, si vous cherchez à devenir un ingénieur en intelligence artificielle ou un développeur en intelligence d'affaires, vous connaissez probablement assez l'apprentissage automatique et tout ce qui l'entoure. Toutefois, si vous souhaitez obtenir cet emploi, vous devrez vous préparer à un entretien d'embauche. Et quel meilleur moyen de le préparer que de réviser les questions de l'entrevue sur le machine learning?
Dans ce cours machine learning, nous examinerons certaines des questions les plus courant de l’entrevue sur l’apprentissage automatique. Nous allons couvrir à la fois les éléments de base et avancés, alors accrochez-vous et passons à l’essentiel!
Contenus
- 1. Introduction
- 1.1. Question 1: Décrivez le ‘machine learning’.
- 1.2. Question 2: C’est quoi le ‘deep learning’?
- 1.3. Question 3: Quelle est la différences entre les erreurs de ‘type 1’ et de ‘type 2’?
- 1.4. Question 4: C’est quoi la ‘L’augmentation des données’?
- 1.5. Question 5: Pourquoi on dit ‘naive Bayes’?
- 1.6. Question 6: Lequel est meilleur – un réseau profond ou un réseau superficiel?
- 1.7. Question 7: C’est quoi la ‘La transformée de Fourier’?
- 1.8. Question 8: C’est quoi un ‘réseau convolutif’?
- 1.9. Question 9: Ce qu’il faut savoir sur la corrélation entre ‘True Positive Rate’ et ‘Recall’?
- 1.10. Question 10: Qu’est ce qu’une ‘rétropropagation’?
- 1.11. Question 11: Que se passe t-il si on utilise uniquement un ‘ensemble de validation’, sans appliquer ‘d’ensemble d’essai’?
- 2. Questions avancées de l’entretien d’ingénieur en machine learning
- 2.1. Question 1: Quelle est la différence entre le modèle ‘génératif’ and ‘discriminant’?
- 2.2. Question 2: Expliquer la différence entre ‘la validation croisée’ et ‘ la validation croisée stratifiée’.
- 2.3. Question 3: Dans quelles situations devriez-vous utiliser “une régression de crête” et “une régression de lasso”?
- 2.4. Question 4: C’est quoi le score ‘F1’?
- 2.5. Question 5: Dans la plupart des cas, lequel des deux a un score plus élevé - les ensembles ou les modèles individuels?
- 2.6. Question 6: Quelle est la différence entre ‘corrélation’ et ‘covariance’?
- 2.7. Question 7: Décrivez un ‘ensemble de données déséquilibré’.
- 2.8. Question 8: C’est quoi la ‘normalisation des données’?
- 3. Conclusions
Introduction
Une fois votre entretien planifié, vous pouvez commencer à préparer et à étudier les questions de l’entretien pour un poste d’ingénieur en machine learning. La meilleure façon de s'y prendre est de commencer par les questions élémentaires. Ce sont celles que vous allez avoir au début de votre entretien. De cette façon, les employeurs veulent voir si vous avez l’esprit critique et si vous pouvez former vos propres pensées de façon cohérente. C’est pourquoi beaucoup de ces questions seront basées sur des définitions, des comparaisons, des explications, etc.
Les Offres Les Plus Récentes Fonctionnelles Actuellement:
GET 50% OFF
DataCamp Black Friday Sale
During this DataCamp Black Friday, you can access the top-rated courses with a 50% discount. Enroll now for way less!
Question 1: Décrivez le ‘machine learning’.
Vous vous y attendiez, n’est-ce pas?
La grande majorité des employeurs vous poseront cette question ou une autre qui lui est une similaire. Ceci, pour deux raisons:
Tout d’abord, ils ne peuvent poser des questions avancées et approfondies avant de s’assurer que avez bien une idée de ce qu’est l’apprentissage automatique. Aussi, la façon dont vous répondrez montrera à quel point vous savez expliquer un sujet difficile de manière compréhensible. Si vous crachez tout un texte issu d’une revue scientifique, vous aurez moins de crédibilité que si vous deviez trouver un moyen de l'expliquer vous-même.
Alors… Qu'est-ce que le machine learning ou l’apprentissage automatique?
La manière la plus simple de décrire l’apprentissage automatique est probablement de dire que c’est la philosophie du développement de l’IA (l’intelligence artificielle). Il s’agit d’un domaine scientifique qui s’intéresse à la fabrication de machines qui tirent des enseignements des informations qu’on leur ont été fournit sans être programmées à l’avance.
Question 2: C’est quoi le ‘deep learning’?
C'est l'une des questions de l'entretien que vous pourriez avoir lors de votre entretien d'embauche. Étant donné que le deep learning est intimement lié au machine learning, vous pouvez même avoir des questions croisées.
L'apprentissage en profondeur est une branche de l'apprentissage automatique. Cette branche scientifique cherche à rendre les réseaux neuronaux de la machine plus proches du cerveau humain.
Question 3: Quelle est la différences entre les erreurs de ‘type 1’ et de ‘type 2’?
Les erreurs de type 1 prétendent que quelque chose est arrivé quand, en réalité, il était impossible que cela se produise. Les erreurs de type 2 font le contraire - prétendent que rien ne s'est passé alors qu’un truc s'est produit.
De telles questions d’entretien sur l’apprentissage automatique risquent d’être un peu déroutantes, mais il existe de nombreuses méthodes que vous pouvez utiliser pour vous faciliter la tâche.
Par exemple, voici une bonne méthode pour vous aider à vous rappeler la différence entre les deux types d’erreurs: imaginez simplement qu’une erreur de type 1 se produit lorsque vous dites à votre chien qu’il est un chat, tandis que dans une erreur de type 2 vous diriez à votre chien que les chiens ne peuvent pas aboyer.
Question 4: C’est quoi la ‘L’augmentation des données’?
La question sur l'augmentation des données est l'une des questions d'entrevue de l’ingénieur en apprentissage automatique les plus simples, elle permet de modifier et de créer de nouvelles données à partir des anciennes. Pour ce faire, laissez la cible telle quelle ou changez-la simplement en une chose déjà connue.
Question 5: Pourquoi on dit ‘naive Bayes’?
Naive Bayes est appelé naïf à cause de sa façon de penser. Cela suppose que tous les éléments d'un ensemble de données sont les mêmes en ce qui concerne leur importance. Inutile de dire que c'est rarement le cas dans un scénario du quotidien.
Question 6: Lequel est meilleur – un réseau profond ou un réseau superficiel?
C’est une question qui vous pousse à faire une comparaison, vous devez en savoir assez sur les deux types de réseaux et être en mesure de les comparer pour les différencier.
Les réseaux profonds sont généralement considérés comme une meilleure alternative. En effet, ils sont composés de plusieurs couches, la plupart cachées. Cela les aide à extraire et à créer de meilleures fonctionnalités.
Question 7: C’est quoi la ‘La transformée de Fourier’?
La méthode appelée “Transformée de Fourier” est utilisée pour transformer des fonctions simples et génériques en super-fonctions. Si vous souhaitez en comprendre d’avantage, vous pouvez le comparer à une situation dans laquelle on vous demande de démonter une voiture et de voir tous les composants et pièces qui la composent.
Question 8: C’est quoi un ‘réseau convolutif’?
Les réseaux simples et normaux utilisent des couches connectées pour effectuer leurs processus. De leur coté, les réseaux convolutifs, au lieu d'utiliser des couches connectées, utilisent des couches convolutives.
La principale raison pour laquelle les gens préfèrent utiliser les réseaux convolutifs par rapport aux réseaux standard à couches connectées est que les réseaux concolutifs ont une plus petite quantité de paramètres qui leur est attribuée.
Question 9: Ce qu’il faut savoir sur la corrélation entre ‘True Positive Rate’ et ‘Recall’?
Bien que cela semble être une question assez avancée, la réponse est assez simple. Ces deux métriques sont identiques. Nous pouvons le voir en regardant leur formule: TP / TP + FN.
Question 10: Qu’est ce qu’une ‘rétropropagation’?
La rétropropagation est simplement une méthode d’entraînement pour les réseaux de neurones multicouches. Nous formons le réseau avec cette méthode en prenant «l’erreur» à la fin de celle-ci et en la plaçant dans chaque poids du réseau. De cette façon, la machine a la possibilité d’appliquer efficacement son calcul.
Question 11: Que se passe t-il si on utilise uniquement un ‘ensemble de validation’, sans appliquer ‘d’ensemble d’essai’?
Logiquement, plus vous avancez dans les question de votre entretien, plus la difficulté augmente, c’est justement le cas de cette question
Si vous n’appliquez qu’un ensemble de validation, il ne fournirait pas une estimation précise de toutes les mesures du modèle que vous essayez de tester. En effet, l’ensemble d’essais sert à tester les performances du modèle sur des exemples qu’il n’avait pas encore rencontrés. Ainsi, si vous supprimez l'ensemble de tests, vous affaiblissez automatiquement les résultats des tests éventuellement valides, pour ainsi dire.
Questions avancées de l’entretien d’ingénieur en machine learning
Maintenant que vous avez une idée de ce qu'est l'apprentissage machine en général et des types de questions sur l'apprentissage automatique et de deep learning auxquelles vous pouvez vous attendre pendant l'entretien d'embauche, nous pouvons passer à des questions plus avancées.
Ne soyez pas dupe, cependant. Il est fort probable que vos employeurs ne vous demanderont pas de construire un système d’IA autonome ni d’écrire un livre de trois cents pages sur les différentes manières d’apprendre le deep learning. Dans notre cas, «avancé» signifie que les questions vont être un peu plus difficiles - on vous demandera peut-être d'expliquer d’avantage vos réponses, de donner des exemples, etc. Alors ne vous inquiétez pas, détendez-vous et commençons!
Question 1: Quelle est la différence entre le modèle ‘génératif’ and ‘discriminant’?
Bien que cela puisse sembler être une question piège, vos employeurs souhaitent simplement savoir comment ces modèles traitent les données.
Comme son nom l’indique, un modèle génératif va consister en un effort pour apprendre les différentes catégories de données fournies. Contrairement à cela, un modèle discriminant étudiera simplement les différences entre les différentes catégories de données.
Les développeurs et les ingénieurs préfèrent généralement utiliser le modèle discriminant, car il a tendance à gérer ses tâches plus rapidement et plus efficacement.
Question 2: Expliquer la différence entre ‘la validation croisée’ et ‘ la validation croisée stratifiée’.
La validation croisée simple est utilisée pour séparer de manière aléatoire des données entre la période d’entraînement et l’ensemble de validation. La validation croisée stratifiée fait la même chose, mais sans la variable aléatoire - elle permet de suivre et de conserver le rapport entre la formation et la validation d’essais. C’est une question qui peut être facilement porter confusion, alors faites attention à cela!
Question 3: Dans quelles situations devriez-vous utiliser “une régression de crête” et “une régression de lasso”?
C’est une question assez avancée, principalement parce que vous avez besoin de connaissances approfondies sur les deux types de régression pour fournir une réponse valable.
La régression de Lasso peut remplir les deux fonctions de sélection de variables et de réduction des paramètres, tandis qu'une régression de crête ne peut être utilisée que la réduction des paramètres. Du coup, on utilise la régression de Lasso lorsqu’on n’a que quelques variables et un effet important. À son tour, une régression Ridge doit être utilisée lorsque les petites variables sont nombreuses.
C’est un bon exemple de ces questions d’entrevue sur le machine learning que vous pourriez développer avec votre propre réponse, et non pas simplement donner une réponse générique.
Question 4: C’est quoi le score ‘F1’?
Non, ce n’est pas une touche de votre clavier sur laquelle vous pouvez appuyer pour obtenir la réponse.
Le score F1 est une mesure de la qualité de votre modèle. Tout ce qui est proche du repère «1» est excellent, tout ce qui se situe sous le repère «0,5» doit être traité.
Question 5: Dans la plupart des cas, lequel des deux a un score plus élevé - les ensembles ou les modèles individuels?
Les ensembles sont généralement ceux qui offrent un score plus élevé. C'est parce qu'ils sont simplement des combinaisons de divers modèles, conçus pour prédire un résultat particulier. Plus il y a de modèles, plus ils peuvent trier les erreurs - meilleur sera le score de prédiction finale.
Question 6: Quelle est la différence entre ‘corrélation’ et ‘covariance’?
Ce n’est pas une question compliquée, sauf si vous ne savez pas comment ces deux éléments sont corrélés.
Si vous le savez, la réponse est assez simple: la covariance devient une corrélation une fois normalisée.
Question 7: Décrivez un ‘ensemble de données déséquilibré’.
Un ensemble de données déséquilibré est un ensemble qui, après les tests, renvoie les résultats selon lesquels plus de la moitié des informations sont stockées dans une seule classe.
Comment pouvez-vous éviter cela? Eh bien, il existe deux solutions simples: refaites le test en utilisant un algorithme différent ou essayez de tester une plus grande quantité de données pour que les résultats soient égaux.
- Facile à utiliser
- Propose un contenu de qualité
- Transparent dans ses tarifs
- Certificats d'achèvement gratuits
- Se focalise sur la science des données
- Rythme d'apprentissage flexible
- Design simple (pas d'information inutile)
- Excellente qualité des cours (même ceux qui sont gratuits)
- De nombreuses fonctionnalités
- Programmes Nano-diplômes
- Idéal pour les entreprises
- Certificats d'achèvement payants
- Très bien établi sur le marché
- Un grand nombre de fonctionnalités
- Cours de niveau universitaire
- Cours de niveau universitaire
- Idéal pour les entreprises
- Certificats d'achèvement payants
Question 8: C’est quoi la ‘normalisation des données’?
Vous vous rappelez quand nous avons parlé de «rétropropagation»? La normalisation des données est utilisée pour minimiser la redondance des données dans le processus de rétropropagation. Il permet à l'utilisateur de redimensionner différentes valeurs à sa guise, éliminant ainsi les problèmes de redondance possibles.
Question 9: Pouvez-vous capturer la corrélation entre les variables catégorielles et continues?
Eh bien, vous pourriez le faire, mais vous devriez utiliser ce que l’on appelle la méthode ANCOVA (Analysis of Covariance). En l'utilisant, vous pouvez capturer la corrélation.
Question 10: À quoi sert la fonction d'activation?
Cette fonction vous permet de diversifier votre réseau en introduisant des méthodes d’apprentissage non linéaires. Cela aidera votre machine à apprendre à traiter plus facilement des processus difficiles.
Saviez-vous?
Vous êtes-vous déjà demandé quels sont les meilleures plateformes d'apprentissage en ligne pour vos objectifs de carrière?
Conclusions
Dans ce cours machine learning, nous avons examiné les questions de l’entrevue sur le machine learning. Nous avons commencé par les notions de base, puis nous avons abordé quelques-unes des questions et réponses plus avancées des entretiens sur le machine learning.
Que vous recherchiez un emploi en tant que spécialiste informatique ou expert en machine learning de l'intelligence artificielle, faites de votre mieux pour réviser et mémoriser ces questions et réponses des entretiens sur le machine learning. Bien sûr, nous avons uniquement abordé le sommet de l'iceberg, mais si vous apprenez ces questions et leurs réponses par cœur, vous devriez au moins développer une idée générale de ce que vous pouvez attendre de l'entrevue.
Nous sommes donc arrivés à la fin de ce cours machine learning. J'espère que ces informations vous seront utiles pour décrocher le travail de vos rêves. Bonne chance!