Junge Sprachwissenschaft e. V.

W3.CSS

Ausgebucht! Anmeldung für die Warteliste möglich.

https://anmeldung.stuts.de/programmieren_wise2023

Programmieren für linguistische Einsteiger in Python

Philipp Hawlitschek (Sprachtechnologie, Universität des Saarlandes)

19.04.2024, 16:00-19:00 + 20.04., 10:30-16:30

Workshopsprache: Deutsch

Nicht nur ist unsere alltägliche Welt zunehmend von Technologie durchdrungen, sondern auch das Forschungsfeld der Linguistik wird immer mehr von digitalen, datengetriebenen Methoden bestimmt. Zu diesem Zweck wollen wir uns in diesem Workshop dem Einstieg in Python widmen. Python hat sich als leistungsfähige und relativ einfache Programmiersprache für eine große Bandbreite an Einsatzmöglichkeiten etabliert. Der Trend geht momentan weg von verschiedenen Programmiersprachen für verschiedene Einsatzzwecke hin zu einem umfassenden Einsatz von Python allein. Es ist geplant, dass sich Erklärungen und Hands-on-Sessions in mehreren Blöcken abwechseln, wobei unser Werkzeugkasten Stück für Stück erweitert und in darauffolgenden Aufgaben eingeübt wird. Wir starten mit einer kurzen persönlichen Vorstellung zum Kennenlernen und gehen danach über zu Inhalten, die in jedem beliebigen Intro zu Python behandelt werden, wie dem allseits bekannten ersten „Hello World“-Programm, der grundlegenden Arithmetik, der Verwendung von Variablen, primitiven Datentypen (Wahrheitswerte, Zahlen, Text), If-Else-Abfragen, Schleifen, Funktionen und zusammengesetzten Datentypen (Tuples, Lists, Dictionaries). Im Weiteren Verlauf soll Wert gelegt werden auf besondere linguistische Einsatzfälle. Dazu gehört das Einlesen und Speichern von Textdateien und Tabellen. Außerdem das automatische Verarbeiten von Text (Wörter zählen, Wörter suchen, Wörter verändern) und einer kleinen statistischen Analyse mit graphischer Ausgabe (Plotten). Als letzte Station behandeln wir die Funktionalität und Implementation eines simplen Language Models (Bi-gram Language Model). Je nach Fortschrittsgeschwindigkeit können wir den Ablauf anpassen und auf bestimmte gewünschte Aspekte näher eingehen. Denkbar wäre eine Demonstration, wie mit eigenen Mitteln das Language Model GPT-2 ausgeführt und eingesetzt werden kann.

Ganz am Ende erhaltet ihr noch einige Handreichungen, wie ihr tiefer in die Materie einsteigen könnt und welche gängigen Tools in modernen linguistischen Projekten angewendet werden. Begleitend zum Kurs und zum Nachschlagen für danach wird ein PDF mit allen behandelten Themen und Beispielen bereitgestellt.

Benötigte Voraussetzungen: Keine Vorkenntnisse benötigt. Eine motivierte Bereitschaft, sich von Misserfolgen nicht entmutigen zu lassen, wird empfohlen.

Benötigte Software:

Zurück zur Workshopübersicht