Freitag in Hamburg haben Sascha Lobo und Holm Friebe aus ihrem Buch Wir nennen es Arbeit gelesen (der Bionade-Faktor im Publikum war übrigens ziemlich hoch).
In dem Buch skizzieren die beiden einen Lebens- und Arbeitsentwurf jenseits fester Anstellungen, den sie als digitale Bohème bezeichnen. Digitale Bohemiens sind eine Mischung aus selbständigem Unternehmer und Künstler und leben und arbeiten vor allem selbstbestimmt. (more…)
Per freundlicher Email-Anfrage wurde ich gebeten, ein wenig Blogpromotion für den Film Weizenbaum. Rebel at Work zu machen. Ein kleines Posting gibt es drüben beim C4. Die Website der Filmmacher enthält einiges an Material jedweder Mediengattung zum Download, Stream, etc. Da auch ich bereits Gelegenheit hatte mit Weizenbaum zu sprechen, kann ich jedem nur empfehlen, sich mit dieser interessanten Persönlichkeit auseinanderzusetzen. Viel Freude mit dem Material!
Trendwatching ist nicht nur trendy sondern unglaublich anstrengend. 8000 Trendscouts arbeiten Trendwatching.com zu. Die Ergebnisse gibt es daher gegen gutes Geld in vielfältigen Formaten. Leider für uns in der Forschungslandschaft nicht immer erschwinglich. Immerhin gibt es hier und da auf der Seite einige funkelnde Ausblicke in die wunderbare Welt der Trends.
Mein Favorit: Generation C, endlich weiss ich wo ich hingehöre.
PS: und was hat das mit Science zu tun? Ich beschäftige mich mit Verfahren der Informatik, um aus den Tiefen des Web inkusive der Blogosphäre Trends aufzuspüren. Mit Verfahren des Crawling, Information Retrieval, Shallow Parsing und Data Mining/Machine Learning. So gesehen ist manuelles Trendwatching ein brauchbarer “Groundtruth”, also die von Menschen ermittelte Faktenlage.
Via Stylewalker kam dieses Sevenload-Video einer gesprächigen Blogrunde. Bekannte Blogger bekommen ein Gesicht! Und sprechen tun die deutschen Blogger natürlich Euroenglish.
Erster! :) Ja liebe Kollegen vom HBS ich warte und warte, dass endlich einer was zu diesem grandiosen Buch postet. Na gut, dann ich. Am Freitag kam das Buch per Post per Amazon, was sonst. Nach 2 Dauerlesesessions je 4 Stunden war ich dann durch. Klingt zu schnell für 250 fein bedruckte Seiten?
Wohlgemerkt ohne überflüssiges Bildmaterial, lediglich geschmackvoll, sparsamen Kapitelillustrationen. Man kann das schaffen, obwohl mir nachgesagt wird ein Schnellleser zu sein. Das Buch ist ganz hervorragend geschrieben, die rechte Mischung zwischen klaren Sätzen und profunder Recherche. Die Autoren sprechen natürlich über ihren erlebten Lebens- und Arbeitsalltag, was der Sache in höchstem Maße zuträglich ist.
Also: Für alle, die ein erfülltes Arbeitsleben jenseits der Festanstellung anstreben, ist dieses Buch die Gebrauchsanleitung. Für alle anderen Menschen? Auch eine dringende Empfehlung. Und wenn es dann hier und da ein wenig eng wird, bspw. wie sich ein Familienleben mit einer unsicheren, nomadischen Arbeitsweise verträgt, dann nehmen die Autoren Stellung, anstatt etwas auszusparen.
Mehr gibts hier nicht, ich verweise auf reges Kommentieren, dies erscheint mir die angebrachte Form der Auseinandersetzung in diesem Fall!
Syntax und Morphologie werden in der Computerlinguistik oft in einem Atemzug genannt, weil es ähnliche Konzepte sind, die beiden Disziplinen zugrundeliegen. Insofern ist die Grenze etwas vage. Morphologie beschäftigt sich mit der Bildung von Wörtern und Syntax mit der Bildung von Sätzen. (Wohlgeformte) Sätze (bzw. Wörter) sind ja normalerweise keine bloße Ansammlung von Wörtern (bzw. Zeichen), sondern erfordern eine bestimmte Struktur – das alles haben wir in der Schule unter dem Begriff “Grammatik” mal gelernt.
Katja Schwab führt einen hervorragenden Weblog namens “Psychologie des Alltags“. Da sie so nett war zu fragen, ob sie den Button benutzen darf, kommt sie nicht nur auf die Blogroll, sondern auch hier einen etwas prominenteren Platz. Vielen Dank! Und ja, den Button kann eigentlich jeder hard blogging scientist benutzen.
Mehrdeutigkeiten – also Wörter, Satzteile oder Satzstrukturen, die mehr als eine Bedeutung haben können – sind ein echtes Problem für alle, die natürliche Sprache verarbeiten wollen. Denn Mehrdeutigkeiten treten nicht nur, wie beim letzten Mal gesehen, in verstümmelten Sätzen oder Stichworten auf. Ganze Sätze können, obwohl sie grammatikalisch wunderbares Deutsch sind, mehrere Bedeutungen haben.
Nehmen wir an, wir suchen Informationen im Internet, etwa über den Verkauf von Chrysler an Daimler. Das ist kein großes Problem, wir suchen nach verkauf chrysler daimler. Google liefert uns dafür nicht weniger als 465.000 Suchergebnisse, viele davon möchten Autos oder Aktien verkaufen, etwas wie einen Zeitungsartikel über den Verkauf selbst finden wir nicht – zumindest nicht auf den ersten paar Seiten, die für einen Menschen noch erfassbar sind.
Bohlen verlegt Haus könnte eine Überschrift von “Bild” sein. Wir möchten mehr darüber wissen, suchen danach – und finden reihenweise Tipps für Heimwerker, wie man Bohlen in seinem Haus verlegt.
Sicher, beide Beispiele sind zu einem gewissen Maß konstruiert und lassen sich durch Umformulierung und / oder dem Hinzufügen weiterer Stichworte reparieren – ich würde einfach mal wetten, dass jede Leserin und jeder Leser schon des Öfteren Zeit damit vergeudetbraucht hat, die richtige Kombination von Suchbegriffen zu finden.
Das Problem ist aber eigentlich ein grundsätzliches und hat vor allem damit zu tun, wie wir Menschen Sprache benutzen und wie schwierig das für einen Computer ist. Genau damit beschäftigt sich das Fach “Computerlinguistik” / “Sprachtechnologie”: Mit der Frage, was man alles wissen und tun muss, um Computer in die Lage zu versetzen Sprache so zu verarbeiten und zu produzieren wie Menschen das tun.
Da das das nächste große “Ding” im Bereich Mensch-Maschine-Schnittstelle Sprache sein dürfte (und weil ich es super-interessant finde) möchte ich hier versuchen, in einer kleinen Serie einen Einblick zu geben, mit welchen Problemen man sich als Computerlinguist so herumschlägt und welche Lösungen und Lösungsansätze dafür existieren. Diese Einführung richtet sich dabei ausdrücklich an alle – Fragen und Feedback sind mir herzlich willkommen (auch weil ich zum ersten Mal systematisch versuche, mein Fach zu erklären ;-) ).
Zum Einstieg: Warum gehen die oben skizzierten Beispiele so schief? Im ersten Beispiel fehlt der Suchabfrage die Information, wer wem was verkauft hat. Was wir da bräuchten, wäre eine Angabe, die besagt, dass Daimler der Käufer ist und Chrysler das gekaufte. Dann könnte Google im Internet nach genau dieser Rollenverteilung suchen. Es könnte ja auch genau andersherum sein oder so dass “Chrysler” und “Daimler” nicht als Firmen gemeint sind sondern als Autos der Marke und eben beide verkauft werden.
Im zweiten Beispiel wissen wir ebenfalls nichts über die Rollenverteilung. Dazu kommt aber noch, dass sowohl “Bohlen” als auch “verlegt” mehrdeutig sind. “Bohlen” können eben Holzbohlen oder ein Eigenname sein, “verlegt” kann im Sinne von “Wohnsitz verlegen” oder “Boden verlegen” gebraucht werden.
Für bessere Suchergebnisse braucht man also eine linguistische Analyse, die Rollenzuweisungen vornimmt und Mehrdeutigkeiten nach Möglichkeit auflöst. Mehr Mehrdeutigkeiten gibt’s beim nächsten Mal, sie treten nämlich auf vielen unterschiedlichen Ebenen auf (und werden von Menschen normalerweise oft nichtmal bemerkt).