» Ein Erfahrungsbericht von Yanik Weißmüller «
Bist Du bereit, Dich auf den Weg zum AWS-Certified-Machine-Learning-Specialist zu machen? In diesem Beitrag begleite ich Dich durch meine eigene Entwicklung vom kompletten AWS-Neuling zum erfolgreichen Abschluss der AWS-Zertifizierung „AWS Certified Machine Learning -  Specialty“. 

Bevor ich meine AWS-Reise begann, hatte ich keinerlei Kenntnisse über AWS-Cloud-Services. Der Gedanke, an der „AWS Certified Machine Learning – Specialty“-Prüfung teilzunehmen, war sowohl herausfordernd als auch einschüchternd. Ich beschloss, kopfüber in die Welt von AWS einzutauchen und der Lernprozess begann.

aws zertifizierung machine learning specialityZunächst begann ich, die zahlreichen Dokumente zu lesen, mich durch die Lehrpläne und Labs im AWS-Skill-Builder zu arbeiten, sowie erste Erfahrungen mit dem Free-Tier-Account zu sammeln. Über einen Zeitraum von etwa einem Monat arbeitete ich mich in die Materie ein und meine Begeisterung für das Thema stieg von Woche zu Woche. Nach gründlicher Vorbereitung erlangte ich dann schließlich meine erste AWS-Zertifizierung, den „AWS Certified Cloud Practitioner“. Dabei handelt es sich um die essenziellste und wohl auch die leichteste Zertifikatsprüfung, für die lediglich die grundlegenden Konzepte von AWS und der Cloud-Technologie erlernt werden müssen.

Meine persönliche Zertifizierungsreise war damit jedoch nicht beendet. Die Grundlagen waren geschaffen und so vertiefte ich mein Wissen, um im April 2024 die AWS-Zertifizierung „AWS Certified Machine Learning - Specialty" abzulegen.

Die „AWS Certified Machine Learning – Specialty“-Prüfung ist eine der anspruchsvollsten AWS-Prüfungen, aber auch eine der lohnendsten. Sie validiert die Fähigkeit, ML-Lösungen für reale Probleme mit AWS-Technologien zu entwerfen, zu implementieren, bereitzustellen und zu warten. Um erfolgreich zu sein, muss ein umfassendes Verständnis von maschinellem Lernen, Datentechnik, maschinellen Lernoperationen (MLOps) und AWS-Cloud-Services-Konzepten erworben werden. In meinem Fall war ich durch mein Mathematik- und Informatik-Studium bereits mit einigen Konzepten des maschinellen Lernens vertraut, doch Data-Engineering und MLOps waren absolutes Neuland.

Ist es schwierig, die AWS-Machine-Learning-Zertifizierung zu erhalten?

Eine anspruchsvolle Prüfung wie die „AWS Certified Machine Learning – Specialty“ erfordert eine ausgiebige Vorbereitung, da es sich um eine AWS-Zertifizierung auf Spezialniveau handelt. Es erfordert einen fundierten Studienplan und gründliche ML-Kenntnisse, welche nur erreichbar sind, wenn man verschiedene Ressourcen wie AWS-Schulungen, Übungstests und Prüfungsdumps nutzt. Realistische Ziele setzen, den Studienplan in überschaubare Stücke zerlegen und den persönlichen Fortschritt zu verfolgen hilft dabei, motiviert zu bleiben.

Diese Lernarbeit erfolgte parallel zu meinem Vollzeitjob, weshalb ich viel Zeit und Mühe investierte, um diese AWS-Zertifizierung zu bestehen. Neben einer hohen Lernmotivation und dem klaren Ziel der Zertifizierung vor Augen, gab es weitere Aspekte, die mich diesen Weg beschreiten ließen:

  • Wissensaufbau zu einer neuen Technologie: Cloud-Computing bietet einige spannende Möglichkeiten, wie z.B. Autoscaling und Serverless-Computing.
  • Jobsicherung: Mit aktuellem Wissen werden die Chancen erhöht, in der eigenen Firma in spannenden Projekten eingesetzt zu werden.
  • Neue Anforderungen: Für einen IT-Betrieb auf Basis von Cloud-Computing entstehen neue spannende Berufsfelder.
  • Spaß: Nicht zuletzt ist es immer ein gutes Gefühl, etwas zu lernen und den eigenen Horizont zu erweitern.

Worum geht es in der Prüfung?

Bevor ich mit dem Lernen begann, war es mir wichtig zu verstehen, was die „AWS Certified Machine Learning – Specialty“-Prüfung bedeutet. Die Prüfung umfasst insgesamt vier größere Themengebiete:

  1. Datentechnik (20 %): Dies deckt den AWS-Big-Data-Stack ab; einschließlich Streaming-Data-Tools (Glue & Kinesis), Storage (S3 & RDS) und Analysen (Kinesis & Athena).
  2. Datenanalyse (24 %): Dies behandelt die Erstellung von Daten für die Modellierung, Feature-Engineering und Datenanalyse, wie man mit fehlenden Daten umgeht, unausgewogene Daten sowie Normalisierung.
  3. Modellierung (36 %): Dies ist der wichtigste Teil der Prüfung und erfordert breite Kenntnisse der SageMaker-Modelle und AWS-Machine-Learning-Produkte.
  4. ML-Implementierung und Betrieb (20 %): Dies umfasst Sicherheit, Einsatz und Optimierung von Lösungen mit SageMaker.

Jedes Themengebiet erfordert ein tiefes Verständnis für eine Vielzahl spezifischer AWS-Dienste und maschineller Lernkonzepte, welche für eine erfolgreiche AWS-Zertifizierungsprüfung entscheidend sind.

Die wohl wichtigsten AWS-Dienste hierbei sind:

  • Amazon Kinesis: Einschließlich IoT, Datenströme, Analysen, Firehose und Videostream
  • AWS Glue: Für ETL, einschließlich Crawler und Datenkatalog
  • Database-Migration-Service (DMS): Zur schnellen und sicheren Migration von Datenbanken
  • Amazon Redshift (Data Warehousing)
  • Amazon RDS: Ideal zum Einrichten, Betreiben und Skalieren von Datenbanken in der Cloud
  • Amazon S3 (Objektspeicherung)
  • AWS Batch: Effizientes Ausführen von Batch-Computing-Aufträgen in jeder Größenordnung
  • Quick Sight (Analysedienst)
  • Cloud Watch: Überwachung und Verwaltung von Cloud-Ressourcen
  • Amazon Comprehend: Ein Muss für Natural Language Processing (NLP) und Textanalyse
  • Amazon SageMaker: Ein unverzichtbares Tool zum Training und Deployment
  • Amazon Lex (Chatbot-Entwicklung)
  • Amazon Rekognition (Computer-Vision)
  • Amazon Textract: Für die optische Zeichenerkennung (Optical-Character-Recognition, OCR)
  • Amazon Polly: Text-to-Speech (Lexika, SSML)
  • Amazon Transcribe: Sprache in Text umwandeln
  • Amazon Translate (Übersetzung)
  • Amazon Forecast DeepAR+: Zeitreihen und Prognosen

Zusätzlich zum Verständnis dieser Dienste sollte man mit Folgendem vertraut sein:

  • Wahrscheinlichkeitsverteilungen (Normal-, Gleich-, Poisson- und Binomialverteilung)
  • Grundlagen der linearen Algebra (Vektoren und Matrizen)
  • Datenformate (CSV, JSON, RecordIO, Parquet)
  • Algorithmen für maschinelles Lernen, insbesondere in SageMaker (Blazing Text, Object2Vec, Factorization-Machines)
  • Umgang mit klassischen ML-Prozessen wie Vorverarbeitung, Feature-Engineering und fortgeschrittenen Techniken (Fehlende Werte, Datenungleichgewicht, Ausreißer)
  • Leistungsmetriken (Precision, Recall, F-Score, Accuracy, ROC-AUC-Kurve, Confusion- Matrix)
  • Aktivierungsfunktionen, Transformationen, Verhinderung von Over- / Underfitting, Hyperparameter (ReLU, Sigmoid)
  • Die Verwendung von AWS-Machine-Learning-Algorithmen für bestimmte Aufgaben (Bildklassifizierung, neuronale Themenmodellierung, Zeitreihen)
  • Random-Cut-Forest-Algorithmus
  • Datenquellen und Speichermedien wie EFS und EBS
  • Datenerfassungsmethoden

Wie bereite ich mich auf die Prüfung vor?

Angesichts des erforderlichen Wissensaufbaus empfehle ich eine ausgiebige und strukturierte Prüfungsvorbereitung. Persönlich bin ich hierbei folgendermaßen vorgegangen:

  1. Grundkenntnisse: Auf der offiziellen AWS-Skill-Builder-Website machte ich mich schnell und kostenlos mit den grundlegenden AWS-Diensten vertraut.
  2. Tiefer in maschinelles Lernen auf AWS eintauchen: AWS bietet neben den Grundlagenkursen eine Vielzahl an weiteren Artikeln zu deren Diensten an. Diese ermöglichten es mir, mein Wissen zu den einzelnen Diensten zu vertiefen. Weiterhin gibt es diverse Plattformen mit ML-Kursen wie Udemy oder Cloud Guru. Meiner Meinung nach waren diese Kurse jedoch eher für Personen gedacht, welche wenig Erfahrung mit ML haben, und die Themenabdeckung war für die Prüfung zu oberflächlich. Besonders hilfreich waren jedoch offizielle AWS-Videos auf YouTube sowie den AWS-Machine-Learning-Blog. Bei vielen Fragen in der Prüfung ging es um Lösungen, die in diesem Blog vorgestellt wurden.
  3. Hands-On-Praxis: AWS bietet ein kostenloses Kontingent, welches es ermöglicht, erste Praxis-Erfahrungen zu sammeln. Ein kleiner Teil meiner Prüfungsfragen bezog sich auch auf praktische Anwendungen. Ich kann daher empfehlen insbesondere Amazon SageMaker vor der Prüfung mindestens einige Male in der Praxis verwendet zu haben.
  4. Scheinprüfungen und Feintuning: Die mit Abstand hilfreichsten Materialien, die ich in meiner Vorbereitung verwendet habe, waren Mock-Tests und Prüfungsunterlagen. Diese halfen mir meinen Fortschritt einzuschätzen und mein Selbstvertrauen zu stärken. Insbesondere kann ich Tutorials Dojo sowie Exam Topics empfehlen. Viele Fragen kamen mir hierbei zunächst nicht relevant vor, jedoch waren es gerade diese Themen, welche in der AWS-Zertifizierungsprüfung häufig zur Sprache kamen. Tutotials Dojo ist eine kostenpflichtige jedoch günstige Plattform, welche realistische Prüfungssituationen mit originalen Prüfungsfragen simuliert und zu jeder Frage eine ausgiebige Erklärung bereitstellt. Exam Topics ist eine kostenlose Sammlung echter Prüfungsfragen, welche von der AWS-Community diskutiert werden.

Wie läuft die Prüfung zur AWS-Zertifizierung ab und welche Kosten fallen an?

Im April 2024 war es für mich so weit, die „AWS Certified Machine Learning – Specialty“-Prüfung abzulegen. Die Prüfung kann entweder vor Ort in einem Prüfungscenter oder remote von zu Hause mit Überwachungssoftware abgelegt werden. In beiden Fällen kostet ein Prüfungsversuch insgesamt 300 USD. Ich entschied mich für die letztere Variante. Die Software überwacht hierbei Desktop, Webcam-Video und Audio des Computers. Während der AWS-Zertifizierungsprüfung dürfen kein Essen, Trinken, Taschenrechner, Papier, Stifte oder ähnliches verwendet werden. Der Raum, in welchem man sich befindet, wird zudem vor der Prüfung mittels Webcam überprüft.

Ein paar Tage vor der Prüfung kann ein Test durchgeführt werden, um die Kamera-, Mikrofon- und Betriebssystemfähigkeit zu überprüfen. Persönlich kann ich sehr empfehlen, vor der Prüfung den eigenen Laptop auf Autostart-Software und Antivirenprogramme zu testen, da diese in meinem Fall mit der Prüfungssoftware korrelierten. Eine stabile Internet-Verbindung ist ebenfalls unerlässliche Voraussetzung. Sollten dennoch technische Probleme auftreten, sind vor und während der Prüfung AWS-Mitarbeiterinnen oder -Mitarbeiter im Chat erreichbar, um technischen Support zu bieten.

Die Prüfung selbst ist drei Stunden lang und umfasst 65 Fragen. Da die Prüfung komplett in englischer Sprache ist, kann man als Nicht-Muttersprachler zudem 30 zusätzliche Minuten Prüfungszeit beantragen. Man hat demnach pro Frage etwa drei Minuten Zeit für seine Antwort. Dies klingt zunächst nach viel Zeit, es gilt jedoch zu bedenken, dass im Gegensatz zur „AWS Certified Cloud Practitioner“-Prüfung nahezu alle Fragen auf Szenarien basieren und daher häufig lang und detailliert sind.

Wie bei allen AWS-Prüfungen gibt es immer mehrere Antwortmöglichkeiten, welche bis auf wenige Ausnahmen alle als angemessene Lösungen erscheinen. Es ist daher wichtig, genau zu lesen und auf Details zu achten.

Prüfungstipp:

Fragen, bei denen man sich unsicher ist, können jederzeit markiert und zu einem späteren Zeitpunkt beantwortet werden. Das spart Zeit.

Ich persönlich brauchte die vollen dreieinhalb Stunden, um die Prüfung abzuschließen. Neben ausreichend Ruhe vor der Prüfung ist das richtige Zeitmanagement wichtig. Es gibt keine direkten Kodierungsfragen, doch es ist beispielsweise erforderlich zu wissen, wann beim Coding die richtigen Bibliotheken oder Algorithmen verwendet werden. Etwa 30 % der Fragen umfassten allgemeines ML und die restlichen 70 % waren mit AWS-Diensten verbunden. Ich hatte viele Fragen zu SageMaker erwartet, schlussendlich gab es jedoch mehr Fragen zum Thema Data-Engineering, ETL, AWS Glue, AWS Kinesis Firehose und Overfitting.

Geheimtipp für die AWS-Prüfung: Lerne die Muster!

Wie bereits erwähnt basieren nahezu alle Prüfungsfragen und Antworten auf Szenarien und sind dadurch lang und detailliert. Dennoch teilen sich viele der Fragen gewisse Formulierungsmuster, welche mir nach ausgiebiger Vorbereitung auffielen. Neben den Übungsfragen war das richtige Erkennen dieser Muster ausschlaggebend dafür, dass ich einen Großteil der Fragen sehr schnell beantworten konnte. Im Wesentlichen lassen sich diese Muster unterteilen in Schlagwörter sowie Ablenkungen.

Beispiel für Schlagwörter:

  • Least effort/Least configuration/Most efficient approach with respect to transformation of data - AWS Glue ist hierbei meist die richtige Antwort
  • Cost effective ingestion - AWS Kinesis Firehose ist hierbei meist die richtige Antwort
  • Best way to deal with huge data sets - SageMaker batch transform ist hierbei meist die richtige Antwort
  • Anomaly detection - Random Cut Forest ist hierbei meist die richtige Antwort
  • Quicken up times - AWS Batch ist hierbei meist die richtige Antwort
  • Realtime - Kinesis Data Streams ist hierbei meist die richtige Antwort
  • Time-series datasets – DeepAR ist hierbei meist die richtige Antwort

Die folgenden Begriffe sind mögliche Beispiele für Ablenkungen oder Antworten, welche in der Regel nicht ausgewählt werden sollten:

  • Mechanical Turk
  • BlazingText
  • Alles, was mit dem AWS-Marketplace zusammenhängt
  • Alles, was mit Apache, OCR oder anderen Nicht-AWS-Technologien zusammenhängt

Fazit zur AWS-Zertifizierung: “AWS Certified Machine Learning – Specialty”

Wenn ich auf meine Zertifizierungsreise zurückblicke, um die AWS-Zertifizierung „AWS Certified Machine Learning – Specialty“ zu erhalten, kann ich mit Zuversicht sagen, dass es eine herausfordernde, aber lohnende Erfahrung war. Durch den Prozess habe ich ein tiefes Verständnis von AWS-Produkten sowie Dienstleistungen gewonnen und mein Wissen über maschinelles Lernen erweitert. Die Prüfung war intensiv, aber es war eine ausgezeichnete Gelegenheit, alle meine Fähigkeiten auf die Probe zu stellen.

Seit dem Abschluss der Prüfung habe ich mein Wissen weiter vertiefen können, was sich in meiner beruflichen Entwicklung als unglaublich wertvoll erwiesen hat. Die „AWS Certified Machine Learning – Specialty“-Zertifizierung zu verfolgen, war eine bedeutende Investition in mein persönliches und berufliches Wachstum. Ich empfehle es jedem, der sein Wissen und seine Fähigkeiten im maschinellen Lernen fördern möchte.

Viel Glück auf Deiner eigenen Reise zur AWS-Zertifizierung!