Was ist ein Entity Recognition?
Entity Recognition, genauer: Named Entity Recognition (NER), ist eine Kernfunktion in der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP).
Damit sollen relevante „benannte Entitäten“ automatisch aus unstrukturiertem Text extrahiert werden, um sie in vordefinierte Kategorien einzuordnen.
Zu den typischen Kategorien gehören:
- Personen (z. B. „Elon Musk“)
- Orte (z. B. „Berlin“)
- Organisationen (z. B. „UNESCO“)
- Daten (z. B. „12. November 2023“)
- Währungen, Zeitangaben, Produkte, Events und viele mehr.
Funktionsweise & Beispiel:
Beim Entity Recognition „liest“ ein Algorithmus einen Text, extrahiert relevante Begriffe und ordnet ihnen die richtige Klasse zu.
Beispiel:
„Im März 2024 reiste Angela Merkel für ein Treffen mit Google nach München.“
Das System erkennt und klassifiziert:„Angela Merkel“ → Person
„Google“ → Organisation
„München“ → Ort
„März 2024“ → Datum
Einsatzgebiete:
- Suchmaschinen: Relevante Einträge oder Entitäts-Vorschläge.
- Chatbots: Bessere, kontextbezogene Antworten auf Nutzereingaben.
- Business Intelligence: Automatisierte Analyse großer Dokumentenmengen.
- Medizin, Recht, Forschung: Extrahieren von zentralen Begriffen aus Fachtexten.
Moderne NER-Systeme nutzen häufig Machine Learning oder Deep Learning, um auch neue, nicht explizit „antrainierte“ Entitäten korrekt zu erkennen.