Διαδικτυακός χάρτης της Σερβίας – SHARE LAB

1
Διαδικτυακός χάρτης της Σερβίας – SHARE LAB
H

Για χιλιάδες χρόνια, οι χάρτες ήταν ένα ουσιαστικό εργαλείο για τους ανθρώπους να ορίσουν, να εξηγήσουν και να προσανατολιστούν στον δρόμο τους στον κόσμο. Οι τοπολογίες δικτύων Διαδικτύου είναι ένα ουσιαστικό εργαλείο για τον χαρακτηρισμό της υποδομής, την κατανόηση των ιδιοτήτων, τη συμπεριφορά και την εξέλιξη του Διαδικτύου.

Στην προηγούμενη έρευνά μας, εξετάσαμε μεμονωμένους παρόχους Διαδικτύου, το μέγεθος και τη δομή τους. Σε αυτό, προσπαθούμε να κατανοήσουμε την αμοιβαία σύνδεση τους, εξερευνούμε το δίκτυο των δικτύων και μπορούμε επίσης να πούμε τις εσωτερικές ιδιότητες του Διαδικτύου.

Διαδικτυακός Χάρτης

Τι βλέπουμε;

Εντοπίζοντας και ακολουθώντας τις διαδρομές (tracerouting) 300.000 διευθύνσεων IP και 30 ISP στη Σερβία, καταφέραμε να δημιουργήσουμε έναν χάρτη με πάνω από 4.500 κύριους συνδέσμους και διακομιστές που αποτελούν τον πυρήνα της εθνικής υποδομής του Διαδικτύου. Με αυτόν τον χάρτη της τοπολογίας του δικτύου, καταφέραμε να εντοπίσουμε: τους κύριους φορείς – εταιρείες (παρόχους υπηρεσιών Διαδικτύου) που κατέχουν και ελέγχουν την υποδομή, έχουν τη δυνατότητα πρόσβασης, διατήρησης, ανάλυσης ή πώλησης μεταδεδομένων χρηστών και στη συνέχεια τα σημεία διασύνδεσής τους, εθνικά Σημεία εξόδου από το Διαδίκτυο και ο βαθμός της υποδομής συγκεντροποίησης σε κρατικό επίπεδο, καθώς και σε επίπεδο μεμονωμένου ISP.

Κάθε σημείο στον χάρτη αντιπροσωπεύει μία διεύθυνση IP (δρομολογητής ή άλλη συσκευή δικτύου), ενώ οι γραμμές μεταξύ των σημείων σύνδεσης είναι τα καλώδια που τα συνδέουν. Κάθε χρώμα αντιπροσωπεύει έναν διαφορετικό πάροχο Διαδικτύου. Να τονίσουμε απλώς ότι πρόκειται για χάρτη της τοπολογίας του Διαδικτύου, δηλ. ότι αυτός δεν είναι φυσικός χάρτης και δεν δείχνει ακριβείς γεωγραφικές τοποθεσίες.

Τα δίκτυα, που λειτουργούν από διαφορετικούς παρόχους υπηρεσιών Διαδικτύου, συνδέονται σε διαφορετικές φυσικές τοποθεσίες όπου οι δρομολογητές τους συνδέονται με καλώδια. Αυτά τα σημεία σύνδεσης ονομάζονται Σημεία Ανταλλαγής Κίνησης Διαδικτύου – IXP (Σημεία ανταλλαγής Διαδικτύου). Αυτά είναι μέρη όπου συναντώνται διαφορετικά δίκτυα, σύνδεση σε ένα ενιαίο σύστημα, επιτρέποντάς μας να συνδεόμαστε σε συσκευές συνδεδεμένες σε άλλα δίκτυα.

ΕγώΟι διασυνδέσεις είναι τόσο η ουσία του Διαδικτύου όσο και έκφραση της επιχειρηματικής σχέσης μεταξύ των παρόχων Διαδικτύου.

Οι περισσότεροι πάροχοι δεν έχουν άμεση σχέση (ρυθμίσεις ομοτίμων) με όλους τους άλλους παρόχους στον κόσμο. Επομένως, με εξαίρεση έναν μικρό αριθμό φορέων εκμετάλλευσης πολύ μεγάλων πολυεθνικών δικτύων, οι περισσότεροι πάροχοι χρειάζονται τουλάχιστον έναν πάροχο διαμετακόμισης για να παρέχουν στους εαυτούς τους (και στους χρήστες τους) πρόσβαση σε ολόκληρο το Διαδίκτυο.

Ανεξάρτητα από το ισχυρό θεωρητικό υπόβαθρο και την εικονικότητα του ίδιου του θέματος, το οποίο ήταν το αντικείμενο αυτής της έρευνας, το τελικό αποτέλεσμα είναι αρκετά συγκεκριμένο.

Το πιο σημαντικό αποτέλεσμα είναι η αναγνώριση της τομής των δικτύων. Αυτά είναι ακριβώς τα σημεία τροφοδοσίας και όσο περισσότεροι πάροχοι συναντώνται σε μια συγκεκριμένη τοποθεσία, δρομολογητή, διακομιστή, τόσο μεγαλύτερη είναι η σημασία και η ισχύς αυτού του σημείου.

Είναι πολύ σημαντικό να γνωρίζουμε ποιος τα κατέχει και ποιος τα ελέγχει επειδή αυτή η οντότητα ελέγχει το Διαδίκτυο στη Σερβία.

Σε κάθε περίπτωση, το πιο σημαντικό είναι ότι το υλικό που προκύπτει από αυτήν την έρευνα μπορεί να χρησιμεύσει ως αφετηρία για κάποια άλλη διεπιστημονική έρευνα που σχετίζεται με την υποδομή του Διαδικτύου στη Σερβία, όπως η μέτρηση της ταχύτητας του Διαδικτύου στη Σερβία, ο βαθμός σκόπιμης επιβράδυνσης της ροής, προσδιορίζοντας τις πιο χρησιμοποιούμενες διαδρομές πρόσβασης στο διαδικτυακό περιεχόμενο κ.λπ.


Μεθοδολογία

Η ερευνητική διαδικασία χωρίζεται σε τέσσερις φάσεις. Δεδομένου ότι κάθε φάση παρέχει το υλικό εισόδου για την επόμενη, κάθε φάση είναι εξίσου σημαντική. Το τελικό αποτέλεσμα ολόκληρης της έρευνας μπορεί επίσης να χρησιμεύσει ως βάση για μια νέα, πιο προηγμένη ανάλυση:

Κάθε συσκευή που είναι συνδεδεμένη στο Διαδίκτυο έχει μία ή περισσότερες διεπαφές μέσω των οποίων επικοινωνεί με άλλες συσκευές στο δίκτυο. Κάθε διεπαφή στο δίκτυο ορίζεται από ένα συγκεκριμένο σύνολο παραμέτρων, μία από τις οποίες είναι η διεύθυνση IP. Μια διεύθυνση IP είναι μια λογική διεύθυνση πρωτοκόλλου Διαδικτύου που επιτρέπει στα δεδομένα να ταξιδεύουν στο Διαδίκτυο από την πηγή τους στον προορισμό τους.

Αν και οι IP είναι πιο λογικές από τις φυσικές, η χρήση μιας διεύθυνσης IP διευκολύνει τον προσδιορισμό σε ποια χώρα βρίσκεται η συσκευή που τη χρησιμοποιεί. Ο λόγος για αυτό είναι ότι οι διευθύνσεις IP εκχωρούνται στους χρήστες από μια διοίκηση. ΙΑΝΑ (Αρχή Εκχωρημένων Αριθμών Διαδικτύου) μέσω RIR (Περιφερειακά Μητρώα Διαδικτύου, RIPE NCC για την Ευρώπη και μέρη της Ασίας) εκχωρεί ένα συγκεκριμένο εύρος διευθύνσεων IP σε οντότητες που ενδιαφέρονται να τις νοικιάσουν, αλλά διατηρούν μια βάση δεδομένων για το εύρος που έχει εκχωρηθεί σε ποιον και άλλα δεδομένα, συμπεριλαμβανομένου του εύρους που σχετίζεται με τη χώρα. Αυτό σημαίνει ότι οι διευθύνσεις IP είναι επίσης φυσικές διευθύνσεις σε κάποιο βαθμό. Οι πληροφορίες είναι διαθέσιμες στο κοινό και υπάρχουν ιστότοποι που εμφανίζουν εύρη διευθύνσεων IP ανά χώρα καθώς και τους κατόχους τους.

Δεδομένου ότι δεν είναι όλες οι συσκευές απευθείας συνδεδεμένες μεταξύ τους (στην πραγματικότητα, πολύ λίγες είναι, π.χ. ακόμη και οι υπολογιστές στο ίδιο γραφείο χρησιμοποιούν δρομολογητή για επικοινωνία), υπάρχει ανάγκη να δρομολογηθεί η κίνηση στο Διαδίκτυο. Αυτό σημαίνει ότι εάν ένας κεντρικός υπολογιστής θέλει να επικοινωνήσει με έναν άλλο στο Διαδίκτυο, πρέπει να δημιουργήσει μια διαδρομή για να συνδεθεί. Αυτή η διαδρομή είναι ουσιαστικά ένα σύνολο διευθύνσεων IP διαφόρων συσκευών δικτύου που επιτρέπουν σε αυτούς τους δύο κεντρικούς υπολογιστές να επικοινωνούν.

Έτσι, για να φτάσουν στη διεύθυνση προορισμού, τα δεδομένα μεταπηδούν από τον έναν κεντρικό υπολογιστή στον άλλο. Για να δείτε πώς συνδέονται δύο κεντρικοί υπολογιστές, χρησιμοποιείται το ICMP (Πρωτόκολλο μηνυμάτων ελέγχου Διαδικτύου), ένα από τα πιο σημαντικά πρωτόκολλα στο σύνολο των πρωτοκόλλων IP. Υπάρχει ένα απλό εργαλείο που ονομάζεται traceroute, που χρησιμοποιείται συχνότερα στα διαγνωστικά δικτύου και κάνει τα άλματα δεδομένων στο δίκτυο ορατά και συστηματικά, δηλ. μπορεί να χρησιμοποιηθεί με την αποστολή μηνυμάτων ICMP και την αναμονή για απαντήσεις από τους κεντρικούς υπολογιστές προορισμού.

Υπάρχει ένα ειδικό εργαλείο για τον εντοπισμό του εύρους των διευθύνσεων IP – Nmap, το οποίο είναι πολύ ακριβές και εύκολο στη χρήση, με το γεγονός ότι, φυσικά, όσο μεγαλύτερο είναι το εύρος, τόσο μεγαλύτερη είναι η εκμετάλλευση των πόρων του υπολογιστή. Ουσιαστικά, το Nmap ανιχνεύει τις διαδρομές μεταξύ των κεντρικών υπολογιστών που ακολουθεί και κάθε διεύθυνσης IP στην περιοχή που σαρώνει.

Σημείωση: Το προϊόν εξόδου στην πραγματικότητα αποτελείται από διαδρομές που συνδέουν τους υπολογιστές προέλευσης με όλους τους ενεργούς κεντρικούς υπολογιστές της περιοχής που λαμβάνουν μηνύματα ICMP.

Με τη σάρωση λάβαμε αυτό που ονομάζουμε «ακατέργαστα δεδομένα» σε αυτήν την περίπτωση. Περιέχουν αρκετά μεγάλο όγκο αχρησιμοποίητων δεδομένων, γεγονός που είναι συνέπεια του ότι οι κεντρικοί υπολογιστές για διάφορους λόγους δεν δίνουν καμία απάντηση κατά τη σάρωση και επομένως είναι άσχετοι με την υποδομή του Διαδικτύου τη στιγμή της σάρωσης.

Τα δεδομένα που είναι πραγματικά χρησιμοποιήσιμα πρέπει να εξαχθούν και να μορφοποιηθούν με κατάλληλο τρόπο, ώστε να μπορούν να χρησιμοποιηθούν ως υλικό εισόδου στο λογισμικό οπτικοποίησης. Το πιο σημαντικό πράγμα είναι να γνωρίζουμε με τι μπορεί να λειτουργήσει το λογισμικό οπτικοποίησης και για αυτήν την έρευνα ήταν το CSV (Τιμές διαχωρισμένες με κόμματα) αρχεία, απλές δομές με 3 πεδία – IP πηγής, IP προορισμού και ετικέτα.

Η έξοδος Nmap μπορεί να αποθηκευτεί σε ένα αρχείο .xml. Και τα δύο αυτά αρχεία είναι στην πραγματικότητα εκδόσεις αρχείων κειμένου, γεγονός που καθιστά τη διαδικασία ανάλυσης δεδομένων πολύ πιο εύκολη. Βασικά, χρειάζεστε λογισμικό που θα παίρνει κείμενο από ένα αρχείο και θα το μεταφέρει σε άλλο. Υπάρχουν πολλές διαθέσιμες επιλογές στο διαδίκτυο για αυτό, κυρίως σενάρια, και έτσι στην περίπτωσή μας χρησιμοποιήθηκε ένα σενάριο python.

Το σενάριο παίρνει δύο τιμές – ένα αρχείο εισόδου και ένα αρχείο εξόδου – και αυτό που κάνει είναι να ψάχνει στα αρχεία κειμένου για συγκεκριμένες λέξεις (σε αυτήν την περίπτωση „ίχνος“ και „ipaddr“) και, όταν πρόκειται για αυτές τις προκαθορισμένες λέξεις, λάβετε τις απαραίτητες τιμές. Τέλος, δημιουργεί ένα αρχείο .csv με την απαιτούμενη δομή (σε αυτήν την περίπτωση παραλείπει μέρος της ετικέτας καθώς δεν χρειάζεται).

Το σενάριο που χρησιμοποιείται είναι διαθέσιμο εδώ.

Σημείωση: Όσοι προτιμούν την Perl από την Python μπορούν να ρίξουν μια ματιά αυτός ο σύνδεσμος.

Για να οπτικοποιήσουμε μεγάλα σύνολα δεδομένων, στην περίπτωσή μας περισσότερες από 300.000 διαφορετικές διευθύνσεις IP και τις μεταξύ τους συνδέσεις, πρέπει πρώτα να βρούμε ένα εργαλείο ικανό να επεξεργάζεται, να εμφανίζει και να μετατρέπει το δίκτυο σε χάρτη. Συνηθίζαμε Οπου?μια διαδραστική πλατφόρμα οπτικοποίησης και έρευνας, που προορίζεται για διαφορετικούς τύπους δικτύων και πολύπλοκων συστημάτων, δυναμικών και ιεραρχικών γραφημάτων.

Η κύρια πρόκληση μας ήταν το ερώτημα πώς να παρουσιάσουμε έναν μεγάλο αριθμό κόμβων με τον πιο βολικό τρόπο και ταυτόχρονα να αποκτήσουμε μια οπτικοποίηση που θα μπορούσε να χρησιμοποιηθεί για περαιτέρω έρευνα. Οι περισσότεροι από τους αλγόριθμους γραφημάτων που ενσωματώθηκαν στο λογισμικό Gephi κατά τη διάρκεια των δοκιμών μας δεν εμφάνισαν με επιτυχία μεγάλα σύνολα δεδομένων με περισσότερους από 100.000 κόμβους, εκτός από εν μέρει τους αλγόριθμους OpenOrd και ForceAtlas2.

Ο αλγόριθμος ForceAtlas2 που χρησιμοποιήσαμε είναι το τέλος Αλγόριθμος συνεχούς διάταξης γραφήματος (διάταξη κατευθυνόμενη με δύναμη). Μπορείτε να βρείτε περισσότερα για αυτόν τον αλγόριθμο εδώ.

Προκειμένου να παρουσιάσουμε τα αποτελέσματα όσο το δυνατόν πιο καθαρά, αποφασίσαμε να εξαλείψουμε τους τερματικούς κόμβους, πρακτικά τους δρομολογητές που βρίσκονται στα άκρα του δικτύου. Αυτό μείωσε και απλοποίησε το σύνολο σε 4067 κύριους κόμβους, διευθύνσεις IP που αντιπροσωπεύουν τη συνδεδεμένη υποδομή των κύριων δρομολογητών και διακομιστών που χρησιμοποιούνται από τους τελικούς χρήστες στη Σερβία.

Nmap ( http://nmap.org/ )

Σενάριο Python που χρησιμοποιείται για την ανάλυση XML σε CSV (γραφή)

Το σενάριο δρομολόγησης ιχνών μας

Οπου ( http://gephi.github.io/ )

Schreibe einen Kommentar