Wörter und Zeichen zählen mit PowerShell

    Die PowerShell bietet alle wesentlichen Werkzeuge zur Bearbeitung und Analyse von Textdateien. Dazu zählt nicht nur die Suche nach dem Vorbild von grep mit select-string, sondern auch das Zählen von Zeichen, Wörtern und Zeilen nach dem Muster von wc unter Unix.

    Wie das wordcount von Unix benötigt man die Zählfunktion unter PowerShell zumeist in Form eines Filters, der die Ausgabe eines Cmdlets oder den Inhalt einer Variablen untersucht. Möchte man ganz einfach die Zahl der Zeichen, Wörter und Zeilen einer Textdatei ermitteln, dann kombiniert man get-content mit measure-object:

    Get-Content mydate.cmd | Measure-Object -line -char -word

    Im Vergleich zu wc ist dieser Aufruf von PowerShell sehr geschwätzig und erfordert einige Tipparbeit. Mit Hilfe von vordefinierten Aliases und Abkürzungen für die Parameter kann man jedoch einiges sparen:

    gc mydate.cmd | measure -l -c -wo

    Standardmäßig zählt measure-object die Zeichen inklusive Whitespace, also unter Berücksichtigung von Tabulatoren, Leerzeichen oder Zeilenvorschüben. Möchte man diese Zeichen ignorieren, dann gibt es dafür den Schalter -IgnoreWhiteSpace. Er lässt sich mit -ig abkürzen.

    Keine Kommentare