Du willst lernen, wie man Gesangs- und Rap-Vocals professionell abmischt? In diesem Guide gehe ich Schritt für Schritt durch meinen kompletten Vocal-Mixing-Workflow – von der Vorbereitung bis zum fertigen Mix.
Eins vorweg: Alle Frequenzangaben und Einstellungen in diesem Guide sind Startpunkte, keine Rezepte. Jede Stimme ist anders. Nutz die Werte als Orientierung und entscheid am Ende immer mit den Ohren.
Vorbereitung: Gain Staging und Editing
Bevor ein einziges Plugin auf die Spur kommt, muss die Grundlage stimmen. Ich habe am Anfang den Fehler gemacht, gleich Plugins draufzuhauen, ohne die Grundlautstärken auszugleichen – das rächt sich später in der gesamten Signalkette.
Gain Staging
Bring deine Vocal-Spuren auf einen sauberen Arbeitspegel. Die Peaks sollten bei etwa -12 bis -6 dBFS liegen. So hat jedes Plugin in der Kette genug Headroom und arbeitet in seinem optimalen Bereich.
Nutz den Clip-Gain (oder Region-Gain) in deiner DAW, um laute und leise Passagen grob anzugleichen, bevor du einen Kompressor einsetzt. Wenn eine Strophe deutlich leiser ist als der Refrain, gleich das per Hand aus. Der Kompressor muss dann weniger arbeiten und klingt natürlicher.
Editing: Aufnahme aufräumen
Nimm dir Zeit für das Editing – es ist der Schritt, der den größten Unterschied macht und am häufigsten übersprungen wird:
- Atmer: Nicht komplett rausschneiden (klingt unnatürlich), sondern auf ca. -15 bis -20 dB runterziehen. In Rap-Vocals können bewusste Atmer sogar Teil der Performance sein.
- Klicks, Pops und Störgeräusche: Manuell rausschneiden. Kurze Fades an den Schnittkanten setzen, damit es nicht knackt.
- Timing: Einzelne Silben oder Wörter, die nicht im Groove sitzen, per Schnitt und Verschieben korrigieren. Nicht übertreiben – leichte Timing-Schwankungen machen den Vocal lebendig.
Pitch-Korrektur
Kleine Intonationskorrekturen sind heute Standard – auch in Genres, die nicht nach Auto-Tune klingen. Tools wie Melodyne, Auto-Tune oder die eingebaute Pitch-Korrektur deiner DAW helfen, unsaubere Stellen dezent zu begradigen. Der Schlüssel: musikalisch und subtil einsetzen. Wenn man die Korrektur hört, ist es zu viel (es sei denn, du willst den Effekt bewusst).
Bei Rap-Vocals ist Pitch-Korrektur meistens weniger relevant als bei Gesang – hier zählt eher das Timing.
Subtraktiver EQ: Probleme entfernen
Jetzt geht es an den Klang. Der erste EQ in der Kette ist subtraktiv – du entfernst Probleme, statt etwas hinzuzufügen.
Low-End Rumble beseitigen
Ein High-Pass Filter (Low Cut) eliminiert unerwünschte tiefe Frequenzen. Die menschliche Stimme schwingt bis etwa 80 Hz mit – alles darunter ist Trittschall, Rumpeln und Rauschen.
- Gesang: High-Pass bei ca. 80–100 Hz
- Rap: Bei modernen Produktionen mit 808s kann ein Cut bis 100–120 Hz sinnvoll sein, damit die Vocals sich neben dem Sub-Bass durchsetzen

Problemfrequenzen finden und absenken
Statt blind nach Frequenztabellen zu arbeiten: Sweep-Methode. Nimm einen schmalen EQ-Band, booste stark (+10 dB) und fahr langsam durch das Spektrum. Wo es unangenehm klingt, hast du eine Problemstelle gefunden. Dort dann gezielt 2–4 dB absenken.
Typische Problemzonen (als Startpunkte, nicht als Regeln):
- 200–400 Hz: Mumpfigkeit, Boominess – besonders bei Aufnahmen in kleinen Räumen oder wenn der Sänger zu nah am Mikrofon war (Proximity-Effekt)
- 400–800 Hz: Boxigkeit, nasaler Klang – hier sitzen oft die Frequenzen, die eine Stimme billig klingen lassen
- 1–2 kHz: Härte, metallischer Klang bei manchen Stimmen
Sei chirurgisch: schmale Cuts, moderate Absenkung. Wenn du mehr als 6 dB an einer Stelle absenken musst, liegt das Problem wahrscheinlich in der Aufnahme, nicht im Mix.
Kompression und De-Esser
Kompression – Dynamik kontrollieren
Die menschliche Stimme hat eine enorme Dynamik. Ein Kompressor gleicht laute und leise Stellen aus, damit die Vocal durchgehend präsent im Mix sitzt.
Startpunkte für die Einstellungen:
- Ratio: 3:1 bis 4:1 (bei Rap ggf. 6:1 für mehr Kontrolle)
- Attack: Mittelschnell, ca. 10–30 ms – zu schnell frisst die Transienten, zu langsam lässt Peaks durch
- Release: So einstellen, dass der Kompressor zwischen den Silben “atmet” – ca. 40–100 ms als Startpunkt, oder Auto-Release nutzen
- Gain Reduction: Zielt auf 3–6 dB im Durchschnitt. Bei Rap-Vocals mit viel Dynamik können auch 8–10 dB nötig sein
Serielles Komprimieren
Statt einem Kompressor, der hart arbeitet, klingen zwei Kompressoren in Serie oft natürlicher: Der erste fängt die Peaks ab (schnelle Attack, wenig GR), der zweite sorgt für gleichmäßigen Pegel (langsamere Attack, mehr GR).
Meine Kombination: 1176LN Rev E + LA-2A. Alternativ ein Opto-Compressor (Empirical Labs EL8 Distressor) mit einem klassischen Compressor (Waves C1 oder FabFilter Pro-C).

De-Esser – Sibilanten kontrollieren
Scharfe S- und Zischlaute (Sibilanten) sind bei Vocals eines der häufigsten Probleme. Ein De-Esser komprimiert gezielt den Frequenzbereich, in dem diese Laute sitzen – meistens zwischen 5 und 9 kHz, je nach Stimme.
Der De-Esser kommt nach der ersten Kompression in die Kette, weil der Kompressor Sibilanten oft noch verstärkt.

Wichtig: Nicht zu aggressiv einstellen. Wenn die Stimme anfängt zu lispeln, ist es zu viel. Lieber dezent de-essen und bei einzelnen besonders scharfen Stellen manuell per Volume-Automation nachhelfen.
Tipp bei der Aufnahme: Wer das Mikrofon leicht schräg stellt (Off-Axis), reduziert Sibilanten schon bei der Aufnahme.
Multiband bei Bedarf
Der Waves C6 hilft bei der Lautstärke-Balance über verschiedene Frequenzbereiche – quasi ein frequenzselektiver Kompressor. Nützlich, wenn z.B. die Höhen bei lauten Stellen zu scharf werden, aber im Rest gut klingen.

Additiver EQ: Klangfarbe gestalten
Jetzt kommt der zweite EQ in der Kette – diesmal additiv. Während der erste EQ Probleme entfernt hat, fügt dieser Charakter hinzu.
Warum zwei getrennte EQ-Schritte? Weil der Kompressor dazwischen die Dynamik verändert. Frequenzen, die vor der Kompression okay waren, können danach anders klingen – und umgekehrt.
Mit einem Pultec EQ oder Izotope Ozone:
- 600–880 Hz: Leichter Boost für mehr Substanz und Wärme. Achtung: Dieser Bereich kann bei manchen Stimmen schnell boxy klingen. Wenn es muffig wird, hier lieber nicht boosten, sondern stattdessen bei den oberen Mitten ansetzen.
- 2–4 kHz: Leichte Anhebung für Durchsetzungskraft und Klarheit – hier sitzt die Sprachverständlichkeit
- 10–14 kHz: Dezenter “Air”-Boost mit einem Shelf-EQ für Offenheit und Glanz. Nicht übertreiben, sonst wird es zischelig.

Reverb und Delay
Reverb und Delay gehören auf Send/Return-Kanäle, nicht als Insert direkt auf die Vocal-Spur. So behältst du die Kontrolle über das Dry/Wet-Verhältnis und kannst den Effekt-Return separat EQen.
Reverb: Ein subtiler Einsatz von Valhalla VintageVerb kann Wunder wirken. Kurze Plate- oder Room-Reverbs (0,8–1,5 Sekunden) platzieren die Stimme im Raum, ohne sie zu verwaschen. Tipp: Den Reverb-Return mit einem High-Pass bei ca. 200–300 Hz und einem Low-Pass bei ca. 8 kHz filtern – so bleibt der Reverb klar und matscht nicht im Low End.

Delay: Ergänzend setze ich oft auch Delay ein (EchoBoy von Soundtoys oder Waves H-Delay) für räumliche Erweiterung. Ein Slapback-Delay (ca. 80–120 ms) gibt Präsenz, ein Ping-Pong-Delay auf Viertelnoten oder punktierten Achteln füllt Lücken zwischen Phrasen.
Chorus und Sättigung
Ein Chorus-Effekt (UAD Studio D oder kHs Chorus) via Send für volleren Klang. Nicht übertreiben – der Effekt soll spürbar, aber nicht offensichtlich sein.
Leichte Sättigung mit Soundtoys Decapitator oder FabFilter Saturn für Wärme und Charakter. Sättigung fügt harmonische Obertöne hinzu, die die Stimme voller und “größer” klingen lassen.

Tipp: Waves Factory Cassette für schöne Sättigung – aber Noise-Generatoren für Vocals deaktivieren.

Automation und Feinschliff
Automation ist der Schritt, der einen guten Mix von einem großartigen Mix trennt. Kein Kompressor der Welt ersetzt gezielte Lautstärke-Automation.
Lautstärke-Automation
Geh deinen Vocal Phrase für Phrase durch und automatisiere die Lautstärke:
- Einzelne Wörter oder Silben, die untergehen, um 1–2 dB anheben
- Wortenden, die wegsterben, leicht hochziehen
- Übergänge zwischen Strophe und Refrain glätten
Das ist Detailarbeit, aber sie macht den Unterschied. Die Vocal klingt danach durchgehend präsent, ohne dass ein Kompressor übermäßig pumpen muss.
Send-Automation
Automatisiere auch die Send-Pegel zu Reverb und Delay:
- Mehr Reverb in ruhigen Passagen, weniger in dichten Stellen
- Delay-Throws auf einzelne Wörter am Ende einer Phrase
Vocals im Mix einbetten
Die Vocal kann noch so gut bearbeitet sein – wenn sie nicht im Beat sitzt, klingt der Mix trotzdem nicht. Besonders wenn du über einen fertigen Stereo-Beat mischt (was für die meisten Bedroom-Producer die Realität ist), brauchst du ein paar Tricks:
Platz schaffen im Beat
- EQ-Cut im Instrumental: Dort, wo die Vocal boosted wird (z.B. 2–4 kHz), kannst du im Beat dezent 1–2 dB absenken. Das reduziert Maskierung und lässt die Stimme durchscheinen, ohne dass du sie lauter drehen musst.
- Sidechain-Ducking: Tools wie Trackspacer oder ein Dynamic EQ können den Beat automatisch leicht absenken, wenn die Vocal spielt – frequenzselektiv und unhörbar subtil.
- Lautstärke-Check: Mix bei niedriger Lautstärke abhören. Wenn die Vocals dann noch verständlich sind, stimmt die Balance.
Vocal-Bus
Fasse alle Vocal-Spuren (Lead, Doubles, Harmonien, Ad-Libs) auf einem Bus zusammen. Dort kannst du eine leichte Bus-Kompression und einen finalen EQ setzen, der alle Vocals als Einheit zusammenklebt.
Rap vs. Gesang: Typische Unterschiede
Die Grundtechnik ist dieselbe, aber die Dosierung unterscheidet sich:
| Rap-Vocals | Gesangs-Vocals | |
|---|---|---|
| Kompression | Aggressiver (6:1+), mehr GR, damit jedes Wort gleich laut sitzt | Moderater (3:1–4:1), natürlichere Dynamik erhalten |
| Reverb | Wenig bis gar nicht (Stimme soll trocken und direkt klingen) | Mehr Raum, Plate oder Hall für emotionale Tiefe |
| EQ Presence | Starker Boost bei 3–5 kHz für Durchsetzung über harte Beats | Dezenter, damit die Stimme nicht scharf wird |
| Delay | Kurzes Slapback für Dicke, Throws auf einzelne Wörter | Längere Delays als gestalterisches Element |
| Tuning | Selten nötig (Sprechgesang hat keine feste Tonhöhe) | Fast immer, zumindest dezent |
| Low Cut | Höher ansetzen (100–120 Hz), Platz für 808s | Tiefer (80 Hz), Brustregister erhalten |
| Doubles | Hart gepannt für Breite, oft jede Hook gedoppelt | Eher als Harmonien oder Backing Vocals |
Was am Ende zählt
Gutes Vocal Mixing ist kein Geheimnis, es ist ein Handwerk aus vielen kleinen, richtigen Entscheidungen. Die wichtigste Erkenntnis aus über 15 Jahren Producing: Die Aufnahme ist 80 % des Ergebnisses. Kein Plugin repariert einen schlechten Raum oder eine schlecht eingepegelte Aufnahme. Investier Zeit in Gain Staging, sauberes Editing und eine ordentliche Aufnahme – der Rest ist Feinschliff.
Experimentier mit den Einstellungen und finde heraus, was zu deinem Stil passt. Hör Referenztracks in deinem Genre und vergleiche. Und vor allem: Vertrau deinen Ohren, nicht den Frequenztabellen.
In welcher Reihenfolge baue ich die Effektkette für Vocals auf?
Eine bewährte Reihenfolge: (1) Pitch Correction, (2) Subtraktiver EQ (Problemfrequenzen raus), (3) Kompressor, (4) De-Esser, (5) Additiver EQ (Charakter, Air, Presence), (6) Sättigung. Reverb und Delay gehören auf Send-Kanäle, nicht direkt in den Insert. Die Reihenfolge ist kein Gesetz – aber dieser Flow löst die meisten Probleme in der richtigen Sequenz.
Wie setzen sich Vocals gegen einen lauten Beat durch, ohne ihn zu zerstören?
Nicht einfach lauter drehen – das macht den Mix nur insgesamt lauter. Stattdessen: Mit einem EQ dezent 1–2 dB im Beat absenken, wo die Stimme Präsenz hat (ca. 2–4 kHz). Tools wie Trackspacer ducken den Beat automatisch und frequenzselektiv, wenn die Vocal spielt. Und immer bei niedriger Lautstärke gegenchecken: Wenn die Vocals dann noch verständlich sind, stimmt die Balance.
Wie viel Kompression ist normal für Rap-Vocals?
3–6 dB Gain Reduction sind ein guter Startpunkt für Gesang. Bei Rap kann es mehr sein – 8–10 dB sind keine Seltenheit, weil jedes Wort gleich laut sitzen soll. Wenn die Stimme anfängt gepumpt oder leblos zu klingen, ist es zu viel. Serielles Komprimieren (zwei Kompressoren mit jeweils weniger GR) klingt oft natürlicher als ein einzelner, der hart arbeitet.
Brauche ich teure Plugins für professionelle Vocals?
Nein. Die Stock-Plugins jeder gängigen DAW reichen für einen professionellen Vocal-Mix. Der Unterschied liegt zu 90 % in der Aufnahmequalität und der Technik, nicht im Plugin-Preis. Wer trotzdem upgraden will: TDR Nova (dynamischer EQ, kostenlos) und Valhalla Supermassive (Reverb/Delay, kostenlos) sind exzellent.
Wie wichtig ist die Aufnahmequalität im Vergleich zum Mix?
Die Aufnahme ist 80 % des Ergebnisses. Kein Plugin repariert einen schlechten Raum, eine falsch eingepegelte Aufnahme oder ein Mikrofon, das nicht zur Stimme passt. Investier in sauberes Gain Staging (Peaks bei -12 bis -6 dBFS), einen Popschutz, und minimale Raumbehandlung – schon Decken oder Matratzen hinter dem Sänger reduzieren Reflexionen hörbar.