Τι είναι τα μεγάλα δεδομένα - Μια απλή εξήγηση με παράδειγμα

Ο όρος Big Data χρησιμοποιείται όλο και περισσότερο σχεδόν παντού στον πλανήτη – διαδικτυακά και εκτός σύνδεσης. Και δεν σχετίζεται μόνο με υπολογιστές. Εμπίπτει κάτω από έναν γενικό όρο που ονομάζεται Τεχνολογία Πληροφορικής(Information Technology) , που αποτελεί πλέον μέρος σχεδόν όλων των άλλων τεχνολογιών και τομέων σπουδών και επιχειρήσεων. Τα μεγάλα δεδομένα(Big Data) δεν είναι μεγάλη υπόθεση. Η διαφημιστική εκστρατεία γύρω από αυτό είναι σίγουρα πολύ μεγάλη υπόθεση για να σας μπερδέψει. Αυτό το άρθρο ρίχνει μια ματιά στο τι είναι Big Data . Περιέχει επίσης ένα παράδειγμα του τρόπου με τον οποίο το NetFlix χρησιμοποίησε τα δεδομένα του, ή μάλλον, Big Data , για να εξυπηρετήσει καλύτερα τις ανάγκες των πελατών του.

Τι είναι τα Μεγάλα Δεδομένα

Τι είναι τα Μεγάλα Δεδομένα

Τα δεδομένα που βρίσκονταν στους διακομιστές της εταιρείας σας ήταν απλώς δεδομένα μέχρι χθες – ταξινομημένα και αρχειοθετημένα. Ξαφνικά, η αργκό Big Data έγινε δημοφιλής και τώρα τα δεδομένα στην εταιρεία σας είναι Big Data . Ο όρος καλύπτει κάθε στοιχείο δεδομένων που έχει αποθηκεύσει ο οργανισμός σας μέχρι τώρα. Περιλαμβάνει δεδομένα που είναι αποθηκευμένα στα σύννεφα και ακόμη και τις διευθύνσεις URL(URLs) που έχετε προσθέσει σελιδοδείκτη. Η εταιρεία σας μπορεί να μην έχει ψηφιοποιήσει όλα τα δεδομένα. Μπορεί να μην έχετε ήδη δομήσει όλα τα δεδομένα. Αλλά τότε, όλα τα ψηφιακά, έντυπα, δομημένα και μη δομημένα δεδομένα με την εταιρεία σας είναι πλέον Big Data .

Εν ολίγοις, όλα τα δεδομένα – είτε είναι κατηγοριοποιημένα είτε όχι – που υπάρχουν στους διακομιστές σας ονομάζονται συλλογικά ΜΕΓΑΛΑ ΔΕΔΟΜΕΝΑ(BIG DATA) . Όλα αυτά τα δεδομένα μπορούν να χρησιμοποιηθούν για τη λήψη διαφορετικών αποτελεσμάτων χρησιμοποιώντας διαφορετικούς τύπους ανάλυσης. Δεν είναι απαραίτητο όλες οι αναλύσεις να χρησιμοποιούν όλα τα δεδομένα. Η διαφορετική ανάλυση χρησιμοποιεί διαφορετικά μέρη των ΜΕΓΑΛΩΝ ΔΕΔΟΜΕΝΩΝ(BIG DATA) για να παράγει τα αποτελέσματα και τις απαραίτητες προβλέψεις.

Τα Big Data(Big Data) είναι ουσιαστικά τα δεδομένα που αναλύετε για αποτελέσματα που μπορείτε να χρησιμοποιήσετε για προβλέψεις και άλλες χρήσεις. Όταν χρησιμοποιείτε τον όρο Big Data , ξαφνικά η εταιρεία ή ο οργανισμός σας συνεργάζεται με τεχνολογία (Big Data)πληροφοριών(Information) ανώτατου επιπέδου για να συναγάγει διαφορετικούς τύπους αποτελεσμάτων χρησιμοποιώντας τα ίδια δεδομένα που αποθηκεύσατε ηθελημένα ή ακούσια κατά τη διάρκεια των ετών.

Πόσο μεγάλα είναι τα Big Data

Ουσιαστικά, όλα τα δεδομένα που συνδυάζονται είναι Μεγάλα Δεδομένα(Big Data) , αλλά πολλοί ερευνητές συμφωνούν ότι τα Μεγάλα Δεδομένα –(Big Data –) ως τέτοια – δεν μπορούν να χειριστούν χρησιμοποιώντας κανονικά υπολογιστικά φύλλα και κανονικά εργαλεία διαχείρισης βάσεων δεδομένων. Χρειάζονται ειδικά εργαλεία ανάλυσης όπως το Hadoop (θα το μελετήσουμε σε ξεχωριστή ανάρτηση) έτσι ώστε όλα τα δεδομένα να μπορούν να αναλυθούν ταυτόχρονα (μπορεί να περιλαμβάνουν επαναλήψεις ανάλυσης).

Σε αντίθεση με τα παραπάνω, αν και δεν είμαι ειδικός στο θέμα, θα έλεγα ότι τα δεδομένα με οποιονδήποτε οργανισμό –μεγάλο ή μικρό, οργανωμένο ή μη– αποτελούν Μεγάλα Δεδομένα για αυτόν τον οργανισμό και ότι ο οργανισμός μπορεί να επιλέξει τα δικά του εργαλεία για την ανάλυση των δεδομένα.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Κανονικά, για την ανάλυση δεδομένων, οι άνθρωποι δημιουργούσαν διαφορετικά σύνολα δεδομένων με βάση ένα ή περισσότερα κοινά πεδία, έτσι ώστε η ανάλυση να γίνεται εύκολη. Στην περίπτωση των Μεγάλων Δεδομένων(Big Data) , δεν χρειάζεται να δημιουργηθούν υποσύνολα για την ανάλυσή τους. Τώρα έχουμε εργαλεία που μπορούν να αναλύσουν δεδομένα ανεξάρτητα από το πόσο τεράστια είναι. Πιθανώς, αυτά τα εργαλεία κατηγοριοποιούν τα δεδομένα ακόμη και όταν τα αναλύουν.

Θεωρώ σημαντικό να αναφέρω δύο φράσεις από το βιβλίο «Big Data» του Jimmy Guterman :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-Και-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Βλέπετε λοιπόν ότι τόσο ο όγκος όσο και η ανάλυση αποτελούν σημαντικό μέρος των Big Data .

Διαβάστε(Read) : Τι είναι η εξόρυξη δεδομένων;(What is Data Mining?)

Έννοιες μεγάλων δεδομένων

Αυτό είναι ένα άλλο σημείο όπου οι περισσότεροι άνθρωποι δεν συμφωνούν. Μερικοί ειδικοί λένε ότι οι Έννοιες Μεγάλων Δεδομένων(Big Data Concepts) είναι τρία V:

  1. Ενταση ΗΧΟΥ
  2. Ταχύτητα
  3. Ποικιλία

Κάποιοι άλλοι προσθέτουν μερικά περισσότερα V στην ιδέα:

  1. Οραματισμός
  2. Ειλικρίνεια (Αξιοπιστία)
  3. Μεταβλητότητα και
  4. αξία

Θα καλύψω τις έννοιες των Μεγάλων Δεδομένων(Big Data) σε ξεχωριστό άρθρο καθώς αυτή η ανάρτηση έχει ήδη γίνει μεγάλη. Κατά τη γνώμη μου, τα τρία πρώτα V είναι αρκετά για να εξηγήσουν την έννοια των Big Data .

Παράδειγμα Big Data – Πώς το χρησιμοποίησε το NetFlix(Big Data Example – How NetFlix) για να διορθώσει τα προβλήματά του

Προς το 2008, υπήρξε μια διακοπή λειτουργίας στο NetFlix λόγω της οποίας πολλοί πελάτες έμειναν στο σκοτάδι. Ενώ ορισμένοι εξακολουθούσαν να έχουν πρόσβαση στις υπηρεσίες ροής, οι περισσότεροι από αυτούς δεν μπορούσαν. Μερικοί πελάτες κατάφεραν να πάρουν τα νοικιασμένα DVD(DVDs) τους, ενώ άλλοι απέτυχαν. Μια ανάρτηση ιστολογίου στη Wall Street Journal αναφέρει ότι το Netflix μόλις ξεκίνησε τη ροή κατ' απαίτηση.

Η διακοπή έκανε τη διοίκηση να σκεφτεί τα πιθανά μελλοντικά προβλήματα και ως εκ τούτου? στράφηκε στα Μεγάλα Δεδομένα(Big Data) . Ανέλυσε περιοχές υψηλής επισκεψιμότητας, ευαίσθητα σημεία και απόδοση δικτύου κ.λπ. χρησιμοποιώντας αυτά τα δεδομένα και εργάστηκε πάνω σε αυτά για να μειώσει το χρόνο διακοπής λειτουργίας εάν προκύψει μελλοντικό πρόβλημα καθώς έγινε παγκόσμια. Εδώ είναι ο σύνδεσμος(the link) προς το Ιστολόγιο της Wall Street Journal(Wall Street Journal Blog) , εάν θέλετε να δείτε τα παραδείγματα των Μεγάλων Δεδομένων(Big Data) .

Τα παραπάνω συνοψίζουν τι είναι τα Big Data σε μια απλή γλώσσα. Μπορείτε να το ονομάσετε μια πολύ βασική εισαγωγή. Σκοπεύω να γράψω μερικά ακόμη άρθρα σχετικά με συναφείς παράγοντες όπως – Έννοιες(Concepts) , Ανάλυση(Analysis) , Εργαλεία(Tools) και χρήσεις Big Data(uses of Big Data) , Big Data 3 V κ.λπ. Εν τω μεταξύ, εάν θέλετε να προσθέσετε κάτι στα παραπάνω, σχολιάστε και μοιραστείτε μαζί μας.

Διαβάστε στη συνέχεια(Read next) : Τι είναι το Web Scraping ;



About the author

Είμαι έμπειρος διαχειριστής Windows 10 και Windows 11/10 με κάποια εμπειρία στο Edge. Έχω πλήθος γνώσεων και εμπειρίας να προσφέρω σε αυτόν τον τομέα, γι' αυτό πιστεύω ότι οι δεξιότητές μου θα ήταν πολύτιμο πλεονέκτημα για την εταιρεία σας. Η πολυετής εμπειρία μου τόσο στα Windows 10 όσο και στα Edge μου δίνει τη δυνατότητα να μαθαίνω γρήγορα νέες τεχνολογίες, να επιλύω γρήγορα προβλήματα και να αναλαμβάνω τον έλεγχο όταν πρόκειται για τη λειτουργία της επιχείρησής σας. Επιπλέον, η εμπειρία μου με τα Windows 10 και τον Edge με κάνει να γνωρίζω πολύ καλά όλες τις πτυχές του λειτουργικού συστήματος, κάτι που θα ήταν επωφελές για τη διαχείριση διακομιστών ή τη διαχείριση εφαρμογών λογισμικού.



Related posts