Folgen

Mal eine Frage an die und Experten.
Gehen wir mal davon aus ihr habt knapp 6 Monate 24/7 Playlist Daten von mehreren deutschen Radiosendern bekommen. (mit 2-3 Ausfällen)

Also "Sender, Datum, Uhrzeit, Künstler, Titel"

Wie würdet ihr das visualisieren? bzw analysieren?

Ich würde zum Beispiel gerne wissen ob ein Sender einen Künstler mehr spielt als alle anderen.

Falls jemand Ideen / Hinweise hat immer her damit. Boosten natürlich auch gerne.

@dasistdaniel

Ich nehm mal an, Deine Zugriffsschicht versteht SQL.

Dann sind die skizzierten Fragen mit ein paar Queries erledigt, sprich: Die Aggregationen gerechnet.

Wenn Du Graphiken willst, kannst Du die erzeugten Datenaggregate nach "R" füttern.

Soweit der deskriptive Ansatz.

Willst Du über die Datenbasis hinaus Erkenntnisse produzieren, brauchts Regressionsmodelle mit F-Tests. Auch die gibts in "R". :)

@textbook aktuell liegt es noch nicht in einer SQL Datenbank bereit, aber der Import ist da kein Problem.

Das Feld ist da meine größere Hürde. Aber nach den Antworten zu urteilen komm ich da an R anscheinend nur kaum dran vorbei.

Danke erstmal.

@dasistdaniel

Für XLS-Dokumente gabs mal einen SQL-Client namens MS-Query. Sehr nützlich aber leider lange her.

Eine enstprechende Lösung aus FOSS oder LibreOffice konnte ich bisher nicht finden.

@dasistdaniel Ich glaub, ich würde da mit Python/SciPy/matplotlib rangehen. Ggf in nem Jupyter Notebook.
Ein interaktives Buch zu SciPy wäre hier in nem Jupyter Notebook, das den gesamten Kram direkt in deinem Browser laufen lässt: mybinder.org/v2/gh/elegant-sci

(Es gibt auch R in nem Jupyter Notebook, falls du den anderen Vorschlag antesten willst: jupyter.org/try)

Alternativ könnte man die Daten auch in nem Elasticsearch Index ablegen und mit Kibana visualisieren.

@anathem vielen Dank. Schau ich mir gerne mal an.
Habe bisher nur mal an Jupyter geschnüffelt es aber noch nicht wirklich genutzt.

Melde dich an, um an der Konversation teilzuhaben
ruhr.social

Mastodon ist ein soziales Netzwerk. Es basiert auf offenen Web-Protokollen und freier, quelloffener Software. Es ist dezentral (so wie E-Mail!).