Videokonferenzen sind gekommen, um zu bleiben. Die Idee und die Technologie ist schon alt, aber mit der Corona Pandemie kam der Durchbruch. Wir freuen uns sicher alle, wenn wir weniger Meetings in Videokonferenzen haben, aber eine komplette Rückkehr in Face-to-Face Begegnungen in stickigen Meeting-Räumen wird es sicher nicht geben.
Manchmal bin ich bei [Mer]Curius antizyklisch unterwegs. Über 12 Monate schrieb jede mir bekannte Technik-Seite über Videokonferenzen, aber ich habe mir das Thema gespart. Nun, wo die Zeichen auf Lockerungen stehen, schreibe ich hier einen Beitrag. Denn ich denke, das Thema wird uns erhalten bleiben. Außerdem haben sich die Dienstanbieter und ihre Angebote im letzten Jahr konsolidiert und man kann sich besser einen Überblick verschaffen.
Wichtig ist eine Abgrenzung, denn Videotelefonie ist nicht gleich Videokonferenz. Viele herkömmliche Videotelefonie-Lösungen (FaceTime, Skype, Jami, auch die entsprechenden Funktionen der Messenger) sind lediglich für Gespräche im kleinen Kreis gedacht und teilweise auch offiziell darauf beschränkt. FaceTime wurde gerade erst auf maximal 32 Teilnehmer ausgedehnt. Das sind Bereiche, in denen Videokonferenz-Systeme erst losgehen. Eine gute Videokonferenz-Lösung sollte in der Lage sein, mindestens 100 Teilnehmer mit Bild und Ton zu verarbeiten. Vermutlich sind die meisten Videokonferenzen kleiner und faktisch nutzen selten alle Bild und Ton gleichzeitig, aber das sollte keinesfalls ein technisch indizierter Zwang sein. Ansonsten könnte das zum Ausschluss von Teilnehmern oder einer Hierarchisierung durch die Erlaubnis bzw. das Verbot Video zu nutzen führen. Alles unterhalb dieser Grenze ist keine Konferenz bzw. Lösung für Videokonferenzen, sondern eine kleine Gesprächsrunde. Dessen ungeachtet taugen die großen Videokonferenz-Lösungen natürlich auch für Zweier-Gespräche.
Ist Sicherheit immer wichtig?
Die erste Frage, die man sich stellen sollte, ist ob es wirklich immer eine Lösung mit Fokus auf Privatsphäre und Sicherheit braucht. Erscheint vielen jetzt vielleicht abwegig, ist es aber nicht.
Bei einer öffentlichen Veranstaltung, die jeder besuchen darf und wo die Teilnehmer oder zumindest die zentralen Personen vielleicht sogar öffentlich im Internet stehen, braucht es keine besonders sichere Lösung. Denn weder Gesprächsinhalte, noch Metadaten (Wer, wo, wie, wann?) müssen geschützt werden. Sie liegen ja sowieso offen.
Bei allen anderen Gesprächen sollten sowohl die Inhalte als auch die Metadaten bestmöglich geschützt werden.
Ende-zu-Ende Verschlüsselung
Ende-zu-Ende Verschlüsselung der Gesprächsinhalte ist normalerweise der Goldstandard, ab dem man anfängt, von Sicherheit zu sprechen. Tatsächlich wurde da im vergangenen Jahr aber viel mit Nebelkerzen geworfen. Insbesondere von der großen Zahl der Zoom-Kritiker. Inhalte-Verschlüsselung bei Videokonferenzen bot faktisch Anfang 2020 noch kein einziger Anbieter!
Inzwischen haben da einige Anbieter nachgelegt. Gegenwärtig bietet das Zoom mit einigen Einschränkungen an, ebenso Cisco Webex, allerdings ebenfalls mit Nebenwirkungen. So schließt man beispielsweise Linux-Nutzer pauschal aus. Bei den freien Systemen bietet das gegenwärtig nur Jitsi Meet. Alle anderen Anbieter haben keine funktionierende Ende-zu-Ende Verschlüsselung. Bei Microsoft Teams ist das seit Anfang des Jahres offiziell in Arbeit, aber wird wohl erst mal nur für Zweier-Gespräche ausgerollt. Damit ist Microsoft allerdings schon weiter als Google, wo das Produkt Google Meet anscheinend nur eine Transportverschlüsselung bietet. Das so gerne gelobte Big Blue Button bietet eine solche Absicherung überhaupt nicht an.
Betreiber – Vertrauen muss wer nicht selber betreibt
Ende-zu-Ende Verschlüsselung schützt allerdings erst mal auch nur die Inhalte – oder auch nicht, wenn es keine Verschlüsselung gibt. Metadaten können dennoch viele anfallen und wie man weiß, sind das die wirklich interessanten Daten.
Viele der Anbieter haben ihren Sitz in den USA. Datenschutz-Aktivisten rufen da immer schnell: „Nicht-DSGVO-konform!“ Aber so einfach ist das nicht. Mit zur Verunsicherung haben Schnellschüsse mancher Datenschutzbeauftragte der Länder beigetragen. Tatsächlich ist das eine Frage der vertraglichen Aushandlung zwischen den beteiligten Parteien und kann gar nicht pauschal beantwortet werden. Schon gar nicht übergreifend von der Schule über die Universität bis zur privaten Firma. Die Situation ist also immer noch hochgradig unklar.
Ganz klar ist aber auch, dass selbst betriebene Instanzen im eigenen Rechenzentrum von BBB natürlich viel datenschutzfreundlicher sind als die Lösungen von Drittanbietern. Das gilt aber nur für den Eigenbetrieb. Sobald man eine BBB-Instanz nutzt, die man nicht selbst betreibt, steht man vor dem gleichen Problem wie bei Zoom & Co.
Leistungsfähigkeit
Und selbst betreiben muss man erst mal können. Während heute jeder privat eine Cloud mit Nextcloud oder Synology aufsetzen kann und Firmen Groupware- und Cloud-Lösungen selbstverständlich selbst betreiben können (was nicht unbedingt bedeutet, dass sie das auch tun!), sieht das bei Videokonferenz-Lösungen ganz anders aus.
BBB kann theoretisch Videokonferenzen mit 100 Teilnehmern inklusive Bild und Ton abhalten. Faktisch scheitern die meisten Firmen und öffentlichen Einrichtungen daran, eine solch leistungsfähige Plattform bereitzustellen. Das heißt es schnell mal „Kamera aus!“ für alle. Für Jitsi ist mir nicht bekannt, dass die Plattform solche Teilnehmerzahlen verkraftet.
Die anderen genannten Alternativen wie Zoom, Webex und Microsoft Teams kommen damit klar. Meiner persönlichen Erfahrung nach ist Zoom hier immer noch stabiler als die Konkurrenz, aber hier gibt es auch gegenteilige Meinungen.
Komfort
Bei vielen hartnäckigen Problemen bleibt der Komfort als Argument oft auf der Strecke. Bevor man sich diesem Punkt zuwenden kann, müssen schließlich erst die wirklich großen Baustellen geschlossen werden. Das erklärt auch den eher schwierigen Zustand in diesem Bereich.
Positiv zu vermerken ist, dass alle Lösungen plattformübergreifend funktionieren. Die Zeiten, in denen Linux-Anwender pauschal ausgeschlossen blieben, sind lange vorbei. Leider war es das dann aber auch schon.
Die meisten Lösungen funktionieren nämlich im Browser nur mit Chrome wirklich gut, was ein erhebliches Manko für den Datenschutz impliziert. Vollwertige Clients für Linux bieten nur Zoom und Microsoft Teams an. Für Cisco Webex gibt es eine abgespeckte Variante. Für BBB gibt es gar keine Clients.
Was Funktionen betrifft, die über den Kern hinausgehen, wie z. B. Breakout-Räume und Kollaborations-Werkzeuge setzt Zoom immer noch Standards.
Zusammengefasst: Es bleibt kompliziert
Wirklich auf der sicheren Seite ist, wer BBB selbst in einem leistungsfähigen eigenen RZ betreiben kann. Für alle anderen bleibt es kompliziert. Den Goldstandard, der Sicherheit und Komfort verbindet und niedrigschwellig für jede Firma oder Einrichtung verfügbar ist, gibt es schlicht noch nicht. Denn setzt man einen Dienstleister für BBB ein, steht man vor dem gleichen Dilemma wie bei Zoom, Webex & Co und das sogar ohne E2E-Verschlüsselung.
Aktualisierung am 16. Juni 2021
Google Meet ergänzt und einige Präzisierungen vorgenommen.
Ich bleib‘ bei Audiochats über Mumble. Dieser Videokram verschwendet Ressourcen und ist zumeist ein Datenschutzärgernis – auch BigBlueButton wird ohne WebRTC (leakt deine IP-Adresse) nicht funktionieren.
Telefonkonferenzen (Mumble ist im Prinzip nichts anderes) ersetzen keine Videokonferenzen, weil Gesichtsausdruck/Mimik/Gestik ein wichtiger Teil der menschlichen Kommunikation sind. Das ist vor allem wichtig, wenn Menschen sich situationsbedingt nicht Face-to-Face treffen können. Videokonferenzen sind der Ersatz für reale Treffen und nicht für das Telefon.
Genau. Ich habe vor Corona regelmäßig an realen Treffen teilgenommen, bei denen ich von mehr als 100 Personen Face-to-Face belästigt wurde.
Es ist kein Geheimnis, dass durch die Videokonferenzen die Teilnehmerzahlen etwas angestiegen sind, weil früher immer irgendwelche Leute die Anreise nicht schafften oder Konflikttermine hatten. Konferenzen mit >50 Teilnehmern waren aber nun wirklich vor Corona auch keine Seltenheit.
Selbst wenn man das Thema „Konferenz“ im engeren Sinne verlässt und sich große Meetings anguckt. Die mittlere Führungsebene vieler Institutionen und Firmen kommt auch locker auf 50 Teilnehmer.
Aber was schreib ich hier. Wenn man ein Phänomen partout nicht wahrhaben möchte, dann ist das halt so. Manche sind halt Einzelkämpfer und können sich was anderes gar nicht vorstellen. Man sollte sich dann halt nicht wundern, wenn man den Anschluss verpasst. Etwas selbst nicht zu nutzen ist das eine, mehr oder minder direkt zu bestreiten, dass es Relevanz hat, das andere.
Konferenzen mit >50 Teilnehmern mag es öfter geben (in der Regel dann aber wohl eher Tagungen mit Vorträgen und Diskussion dazu, und keine gleichberechtigten Gesprächsrunden. Daraus aber abzuleiten, das es dafür ein System braucht, bei dem hundert Kameras und Mikrophone gleichzeitig übertragen werden können, halte ich für gewagt. Die Kakophonie möchte ich nicht erleben. Bei Treffen dieser Größenordnung braucht es wohl eher gute Moderationsmöglichkeiten in der Software, man muss nur diejenigen hören und sehen, die jeweils auch etwas zu sagen haben, das dürften wohl kaum mehr als 10 Personen gleichzeitig sein.
Ansonsten ist halt Disziplin gefragt, man meldet sich wenn man was zu sagen hat und bekommt dann Mikro und Kamera freigegeben.
Das ist diese typische Open-Source-Grundhaltung, mit der ich nichts anfangen kann: Ich habe keine technische Lösung, also behaupte ich, dass ich das gar nicht brauche/nicht so brauche/niemand es so braucht und dann funktioniert plötzlich meine Open Source-Lösung für den definierten Restbedarf. Das ist die Umkehrung von Ziel/Mittel und stellt die IT ins Zentrum, anstelle der Bedarfe.
Mmhhh… den Open-Source-Bezug konnte ich jetzt nicht erkennen.
Bei den Veranstaltungen, an denen ich teilnehmen durfte, waren bei bis ca. 30 Teilnehmern noch die Kamera an und das Mikro konnte selber gesteuert werden. Dann wurde es aber auch sehr unübersichtlich. Und fehlende Disziplin hat bei manchen „Darth-Vader“-Erinnerungen geweckt. Dann wurde auch die meisten Kacheln verschoben, so dass man die anderen Teilnehmer sowieso nicht sehen konnte.
Größere Veranstaltungen wurden im kommerziellen Umfeld grundsätzlich eher mit dafür spezialisierter Software (oder entsprechend konfigurierter VSK) durchgeführt – mit Kamera und Mikro zentral deaktiviert.
Eine Veranstaltung im kommerziellen Umfeld mit mehr als 50 Teilnehmern, die alle ihre Kamera aktivieren wollen/sollen und selber über das Mikro entscheiden dürfen, kenne ich nicht. Existiert wirklich dafür ein Markt?
(Ich antworte mal auf mich selbst, damit das hier nicht zu schmal wird)
Den Open Source Aspekt habe ich da scheinbar tatsächlich selbst reingelesen. Hintergrund sind die Defizite bei der Leistungsfähigkeit von BBB und Jitsi, die Befürworter oft dazu verleitet einfach Funktionen für überflüssig zu erklären, um das zu kaschieren.
Zum anderen Punkt: Ich sitze pro Woche (leider) im Schnitt in circa 15 Videokonferenzen. Teilnehmerzahl 3-300. Also kleiner Gesprächskreis bis Massenveranstaltung. Die beschriebenen Phänomene kenne ich nur aus den Anfangszeiten zu Beginn der Pandemie. Grundlage ist natürlich, dass alle beim Betreten erst mal stumm geschaltet sind, aber das ist ja inzwischen bei allen Softwarelösungen Standard. Entweder ist mein berufliches Umfeld besonders digital-affin (was ich schon aufgrund des Durchschnittsalters nicht glauben kann), besonders rücksichtsvoll (kann gut sein), besonders anarchisch und setzt auf viel Beteiligung (glaub ich aber auch nicht, es ist schließlich ÖD) oder es gibt einfach unterschiedliche Arbeitskulturen.
Aber klar ist natürlich auch, je höher die Teilnehmerzahl, desto eher nimmt ein Großteil der Teilnehmer eine passive Rolle ein und schaltet dann auch die Kamera aus. Das hängt dann halt auch vom Format ab.
„BBB kann theoretisch Videokonferenzen mit 100 Teilnehmern inklusive Bild und Ton abhalten. [..] Für Jitsi ist mir nicht bekannt, dass die Plattform solche Teilnehmerzahlen verkraftet.“
Wir nutzen teilweise Jitsi mit gut 250 Teilnehmern (aber nur mit einer eingeschalteten Kamera). Meines Wissens ist aber das Entwicklerteam deutlich konservativer und rät zu weniger Teilnehmern.
Das ist der springende Punkt. Meiner Meinung nach sollte eine Video(!)-Konferenz-Lösung es zumindest theoretisch ermöglichen, dass jeder zugeschaltete Teilnehmer mit Kamera dabei sein kann (aber natürlich nicht muss). Wenn eine Lösung das nicht bieten kann, dann ist das eine Einschränkung.
Zumindest mit den mir bekannten Lösungen und Hardware macht es definitiv keine Sinn. für 100 oder noch mehr Teilnehmer gleichzeitig die Kamera oder den Ton freizuschalten. Es fällt mir auch zugegebener Weise schwer, mir dafür sinnvolle Einsatzzwecke vorzustellen, aber da mag mein Erfahrungshorizont (und Bandbreite der Internetanbindung) zu eingeschränkt sein. Für wichtiger halte ich jedenfalls andere Funktionen, z.B. gute Moderationsmöglichkeiten, gutes Chatsystem, klar sichtbare Wortmeldungen, Möglichkeiten für screenshots und Videomittschnitte (und die Möglichkeit, dafür Rechte zu vergeben, damit das nicht jeder kann), Einwahlmöglichkeiten per Telefon, permanenten Passwort Geschütze Räume für regelmäßige Besprechungen, usw.
Jitsi will ich damit übrigens nicht verteidigen, das nutze ich zwar fast täglich, es erfüllt aber von den oben genannten Anforderungen auch nur höchstens die Hälfte und ist insgesamt eine sehr minimalistische Lösung für kleine Gruppen.
„Für wichtiger halte ich jedenfalls andere Funktionen, z.B. gute Moderationsmöglichkeiten, gutes Chatsystem, klar sichtbare Wortmeldungen, Möglichkeiten für screenshots und Videomittschnitte (und die Möglichkeit, dafür Rechte zu vergeben, damit das nicht jeder kann)“
Volle Zustimmung! Ich hatte das nicht explizit thematisiert, weil ich den Eindruck hatte, dass hier alle Lösungen bereits ein gutes Niveau bieten. Liege ich da falsch?
„Einwahlmöglichkeiten per Telefon“
Soweit ich das verstanden habe, beißt sich das mit E2E-Verschlüsselung.
Noch zwei Ergänzungen: irgendwie vermisse ich TeamViewer Meeting, welches wohl wenigstens von einer deutschen Firma DGSVO-konform(?) angeboten wird. ich habe aber selbe keine Erfahrung damit. Ein weiterer großer Anbieter, der nicht erwähnt wird, ist Google Meet. Beide bieten angeblich eine Verschlüsselung an. Beide sollen auch mit über 100 Teilnehmern funktionieren.
Ansonsten ist Chrome für viele Videokonferenzen die Basis. Aber man kann sie auch mit den Derivaten wie Edge (natürlich von der Pfanne ins Feuer), Vivaldi etc. nutzen. Die Clients von Zoom, Teams, Discord etc. sind eigentlich auch nur verkappte Browser-Anwendungen (eben Electron – chromium Basis) – mit allen Nachteilen.
Stimmt. TeamViewer und Google Meet habe ich vergessen. Allerdings haben ich im Gegensatz zu allen oben genannte Lösungen damit noch gar nichts zu tun gehabt.