Thema: Automatisierung des Abgleiches von Fehllisten und Dublettenlisten
robste1987 Am: 02.04.2023 19:39:00 Gelesen: 458# 10@  
@ drmoeller_neuss [#8]

Technischer Teil

Das Laufzeitproblem entsteht nicht, weil eine Bundsammlung einige Tausend statt einiger Dutzend Einträge hat. Eine längere Liste wirkt sich in etwa Proportional auf die Laufzeit aus. Wenn ich das Programm auf meinen PC ausführe um meine Listen mit denen von fünf Sammlerfreunden abzugleichen, ist die Abgleichsmethode wirklich egal.

Das Problem entsteht, wenn ich von vielen Sammlern die Listen mit den Listen von vielen anderen Sammlern auf einem Server abgleichen will. Wenn 500 Fehllisten sollen mit 500 Dublettenlisten in jeder Kombination abgeglichen werden. Dann sind dann 500*500= 250000 Abgleiche. Wenn ich da bei jedem Abgleich etwas CPU-Zeit spare, spielt das doch eine Rolle. Erst recht wenn der Server noch etwas anderes tun soll oder das Programm in der Cloud läuft und ich für CPU Zeit zahlen muss.

Es mag sein, dass CPython zu dem Zeitpunkt der Antwort auf stackoverflow (fast zehn Jahre her) intern so gearbeitet und vielleicht heute noch so arbeitet. Denkbar ist es, dass die Listen zuerst sortiert werden und dann abgeglichen wird. Dann braucht man nicht mehr unbedingt alle Elemente jedes mal abklappern. Oder das man mit einer Kopie des Datensatzes arbeitet und alle Elemente die schon als Schnittmmenge bekant sind aus der Kopie löscht damit man sie nicht erneut durch interiert.

Der Sinn von Hochsprachen ist gerade, dass man sich weniger mit low-level code auseinandersetzt und eine Optimierung so gleich viel Code beschleunigt, ohne das er umgeschrieben werden muss.

Der Vergleich mit dem Frühstück ist ungenau. In jedem Supermarkt kann ich die Zutaten für ein übliches Frühstück bekommen. Es ist aber unrealistisch von Hobbysammlern zu erwarten, dass Sie genau die Briefmarken als Dublette haben die mir noch fehlt. Ich habe es durchaus schon erlebt, dass ich von fünf Händlern kaufen sollte um 6 Briefmarken zu erhalten. Stückpreis pro Marke immer unter 0,10€, Versandkosten aber 1€ pro Sendung, aus dem Ausland. Oder das potentielle Tauschpartner aus dem Ausland erst Tauschen wollten wenn 100 Michel-Euro Tauschvolumen zusammen kommen, weil sonst das (Einschreibe-)porto als zu hoch empfunden wurde. Es ist frustrierend lange manuell Tauschlisten zu bearbeiten und dann festzustellen, das man nur auf 80 Michel Euro kommt.

Nicht-technischer Teil

Ich möchte es positiv statt negativ ausdrücken:

* Ich freue mich in diesem Thema über Kommentare von Henry, Ben11 oder den von 22028 sehr gefreut, weil ich diese als freundlich und konstruktiv empfinde. Auch und gerade wenn sie mir abraten oder den Nutzen meiner Idee anzweifeln!

* Mein Studium und einen Nebenjob als Softwareentwickler machen mir genug Arbeit und Herausforderungen.

* Mir ist es am wichtigsten Menschen unter 25 für das Sammeln von Briefmarken zu begeistern

* Gerne engagiere ich mich in einem Umfeld wo ich für konstruktive Kritik erhalte und Mitstreiter finde

Fazit:

In den letzten Tagen habe ich etwa zwei-drei Stunden am Quelltext geschrieben und mich mit konstruktiver Kritik beschäftigt. Das hat wirklich Spaß gemacht. Dem stehen fast sechs Stunden mit Knatsch aller Art verbrachte Zeit gegenüber, die wirklich keinen Spaß gemacht hat.

Das
 
Quelle: www.philaseiten.de
https://www.philaseiten.de/thema/18048
https://www.philaseiten.de/beitrag/316518