Descript
Audio- und Video-Editor mit text-basiertem Schnitt-Workflow. Hobbyist $16/Monat jährlich. EDU-Rabatt verfügbar. Creator-AI nur ab Creator-Plan.
Descript
Descript ist ein Audio- und Video-Editor, bei dem du den Schnitt nicht in der Timeline machst, sondern im Transkript. Du liest den Text, streichst was raus soll, und das Audio oder Video folgt automatisch. Für Studierende die Interviews transkribieren, Vorlesungsmitschnitte aufbereiten, Podcasts produzieren oder Lehrvideos schneiden, ist das ein anderer Workflow als klassische Schnittsoftware — schneller für Sprach-Content, aber kein Ersatz für komplexen Videoschnitt. Für Video-Generierung → Runway oder Veo (Google DeepMind); für Avatar-Sprecher → HeyGen oder Synthesia.
Wofür du das nutzt
- Audio transkribieren. Interviews, Vorlesungsmitschnitte oder Sprachmemos hochladen, automatisch transkribieren lassen — in 25 Sprachen, inklusive Deutsch. Das Transkript kann als Protokoll, Zitat-Sammlung oder Arbeitsgrundlage für eine Hausarbeit dienen.
- Vorlesung transkribieren. Aufnahme der Vorlesung importieren, automatisches Transkript, dann im Text nach Schlüsselbegriffen suchen — deutlich schneller als Zeitleisten-Suche in einem Audioplayer.
- Interview transkribieren. Qualitative Forschung, Journalismus, sozialwissenschaftliche Hausarbeiten: Descript transkribiert, du korrigierst den Text, und hast gleichzeitig ein sauberes Protokoll und ein geschnittenes Audio.
- Podcast schneiden. Füllwörter entfernen, Pausen kürzen, Abschnitte umordnen — alles im Text-Editor. Kein Wellenform-Puzzeln. Für studentische Podcasts oder Seminar-Podcasts der schnellste Weg zu einem sauberen Ergebnis.
- Video bearbeiten wie ein Dokument. Screencast, Seminarvortrag oder Lernvideo aufzeichnen, im Transkript schneiden, als MP4 exportieren. Für alles unter 30 Minuten ist Descript schneller als Premiere oder DaVinci.
- Untertitel erstellen. Automatische Captions aus dem Transkript, als SRT-Export oder direkt gebrannt. Für Barrierefreiheit in Lehrvideos oder Social-Media-Clips.
Stärken im Detail
- Text-based Editing ist das Kern-Differenzierungsmerkmal. Statt Audiowellen zu trimmen, streichst du Sätze im Transkript — Descript entfernt das entsprechende Audio-Segment automatisch. Das ist besonders bei Sprachaufnahmen mit vielen Korrekturen ein massiver Geschwindigkeitsvorteil.
- Füllwörter-Entfernung per Knopfdruck. "Remove Filler Words" erkennt und entfernt automatisch Ähs, Ähms und andere Füllwörter. Manuelles Suchen entfällt komplett.
- Overdub / KI-Stimme für Korrekturen. Wenn du nach dem Schnitt einen Versprecher korrigieren willst, kannst du den Ersatz-Text eintippen — Descript generiert die entsprechende Audio-Passage in deiner Stimme. Kein Neu-Aufnehmen für einzelne Sätze.
- Screencasting + Schnitt in einem Tool. Descript nimmt direkt auf (Screen, Kamera, Mikrofon) und öffnet die Aufnahme sofort im Editor — kein Import-Export zwischen Recording- und Schnitt-Tool.
Grenzen & wo's hakt
- Free-Tier ist für ernsthaftes Arbeiten zu eng. 60 Minuten Medienminuten pro Monat und nur 100 einmalige KI-Credits — wer zwei Interviews im Monat macht, ist sofort limitiert. Export nur in 720p mit Wasserzeichen.
- Keine Live-Meeting-Transkription. Descript ist kein Meeting-Bot. Für automatische Meeting-Notizen sind Fathom oder Granola die richtigen Tools — Descript kommt danach für Schnitt und Aufbereitung.
- Textschnitt ist nicht für alle Inhalte geeignet. Bei Musik, B-Roll-Montagen oder Interviews mit vielen Überschneidungen kommt man schnell an die Grenzen des text-basierten Workflows.
- Desktop-App braucht Ressourcen. Die macOS/Windows-App ist kein Leichtgewicht — auf älteren Rechnern kann das Rendering von 1080p-Projekten merklich ruckeln.
- Einwilligung bei Fremdaufnahmen. Interviews, Gruppengespräche oder Vorlesungen darf man nicht ohne Einwilligung der aufgenommenen Personen hochladen und transkribieren. Das gilt auch wenn du die Datei danach löschst.
Pricing (Stand 05/2026)
Free — 0 USD/Monat 60 Medienminuten/Monat, 100 KI-Credits einmalig, 720p-Export mit Wasserzeichen, 5 GB Storage. Für kurze Tests ok, für regelmäßige Arbeit zu knapp.
Hobbyist — ~16 USD/Monat (oder ~24 USD monatlich ohne Jahresabo) 10 Stunden Medien/Monat, 400 KI-Credits/Monat, 1080p-Export ohne Wasserzeichen, 100 GB Storage.
Creator — ~24 USD/Monat (beliebteste Option, oder ~35 USD monatlich) 30 Stunden Medien/Monat, 800 KI-Credits/Monat, 4K-Export, 1 TB Storage, volle KI-Tool-Suite, Royalty-free Stock-Media.
Business — ~50 USD/Monat (oder ~65 USD monatlich) 40 Stunden Medien/Monat, 1.500 KI-Credits, Dubbing und Übersetzung (30+ Sprachen), Custom Avatars, bis zu 5 Sitzplätze, 2 TB Storage.
Für Studierende ist der Hobbyist-Plan der sinnvolle Einstieg wenn die Free-Limits nicht reichen.
Praxis-Workflow
- Aufnahme erstellen oder importieren. Eigene Mikrofon-Aufnahme, Smartphone-Memo oder Vorlesungsmitschnitt direkt in Descript ziehen.
- Transkription starten. Sprache einstellen (Deutsch), transkribieren lassen — dauert je nach Länge 1–3 Minuten.
- Im Text korrigieren. Verständnisfehler im Transkript direkt editieren, Sprechernamen zuweisen bei Interviews.
- Füllwörter entfernen. "Remove Filler Words" ausführen — Ergebnis prüfen, Über-Entfernungen manuell rückgängig machen.
- Abschnitte kürzen. Unwichtige Passagen im Transkript markieren und löschen — Audio folgt automatisch.
- Exportieren. Als MP3/MP4 für Weiterverarbeitung in Runway, oder als Transkript-DOCX für Hausarbeiten und Protokolle.
Datenschutz (kurz)
Descript verarbeitet hochgeladene Audio- und Videodateien auf US-amerikanischen Servern (Infrastruktur auf AWS). Hochgeladene Dateien werden für Transkription und KI-Funktionen genutzt; Trainings-Opt-out ist in den Konto-Einstellungen verfügbar (Stand 05/2026). Für Interviews oder Vorlesungsaufnahmen mit Dritten: Einwilligung einholen bevor du hochlädst — die DSGVO gilt auch wenn der Dienst in den USA sitzt. Keine DSGVO-zertifizierte EU-Infrastruktur.