Έρευνα & Ανάπτυξη

Η συγκέντρωση και η ανάλυση μεγάλου όγκου κειμένων και αρχείων πολυμέσων τόσο από τα παραδοσιακά όσο και από τα μέσα κοινωνικής δικτύωσης είναι μία από τις βασικές δραστηριότητες της Paloservices. Η τεχνολογία μας συνδυάζει την εξόρυξη, την ανάλυση, την οπτικοποίηση δεδομένων και τεχνικές επεξεργασίας φυσικής γλώσσας.

Η κύρια δραστηριότητα της Paloservices είναι η αποτελεσματική αξιοποίηση των Big Data μέσω της οργάνωσης, της ανάλυσης και της δομημένης παρουσίασης των πληροφοριών που προέρχονται από τα ελληνικά μέσα ενημέρωσης, τα οποία περιλαμβάνουν πρακτορεία ειδήσεων, μεμονωμένους bloggers και δημοσιογράφους καθώς και εφαρμογές κοινωνικής δικτύωσης και φόρουμ.

Στο πλαίσιο αυτό δημιουργήσαμε μια πλατφόρμα ανάλυσης μέσων, η οποία είναι μοναδική στην Ελλάδα και ανάμεσα στις λίγες υπερσύγχρονες προσπάθειες παγκοσμίως. Τα εργαλεία μας συλλέγουν και επεξεργάζονται συνεχώς, περιεχόμενο από πολλαπλές πηγές στο διαδίκτυο, επίσημες και ανεπίσημες.

News Summary Extraction

Η λειτουργία εξαγωγής περιλήψεων ειδήσεων είναι ένα εργαλείο αιχμής για τον κλάδο των ειδήσεων. Χρησιμοποιούμε προηγμένη τεχνολογία για την αυτόματη δημιουργία περιλήψεων των κειμένων των δημοσιογράφων, παρέχοντας έναν γρήγορο και εύκολο τρόπο στους αναγνώστες να ενημερώνονται χωρίς να χρειάζεται να διαβάσουν κάθε άρθρο σε ένα σύμπλεγμα. Αυτή η λειτουργία προσφέρει μια συνοπτική και περιεκτική επισκόπηση των ειδήσεων.

Ngram Example

Οι “Περιλήψεις” προσφέρουν τεχνολογία αιχμής στη δημοσιογραφική περίληψη κειμένων. Η μηχανή περίληψης εφαρμόζεται επί του παρόντος σε ομάδες ειδήσεων (δηλαδή στις ομάδες ειδησεογραφικών κειμένων που αναφέρονται στο ίδιο γεγονός). Επεξεργάζεται όλα τα κείμενα της συστάδας χρησιμοποιώντας τεχνικές επεξεργασίας φυσικής γλώσσας και αλγορίθμους γραφημάτων και εξάγει μια μικρή αλλά περιεκτική περίληψη που περιέχει τα πιο βασικά θέματα, τα κυριότερα σημεία της συστάδας. Αυτές οι σημαντικότερες πτυχές μιας συστάδας ειδήσεων παρουσιάζονται με μια ματιά στον χρήστη που θέλει να έχει μια γρήγορη εικόνα για το τι πραγματεύεται η συστάδα.

Όταν προστίθενται νέα άρθρα στη συστάδα, οι “περιλήψεις” ενημερώνονται ώστε να ανταποκρίνονται στην τρέχουσα κατάσταση των πληροφοριών.

Παράδειγμα περίληψης

Sentiment Analysis

Η ανάλυση συναισθήματος είναι μια τεχνική που χρησιμοποιείται για την κατανόηση των συναισθημάτων και των απόψεων που εκφράζονται σε κείμενα σχετικά με συγκεκριμένες οντότητες, όπως εταιρείες, άτομα ή προϊόντα. Οι αλγόριθμοί μας μπορούν να εντοπίζουν τις οντότητες που αναφέρονται σε ένα κείμενο, να αναγνωρίζουν τους διαφορετικούς τρόπους γραφής τους (π.χ. πλήρες όνομα ή αρχικά) και να εντοπίζουν λέξεις που εκφράζουν θετικές ή αρνητικές απόψεις. Επιπλέον, χρησιμοποιούμε συντακτική ανάλυση για να προσδιορίσουμε τον συνολικό συναισθηματικό τόνο του κειμένου και να συγκεντρώσουμε τις απόψεις για να προσδιορίσουμε τον συνολικό συναισθηματικό αντίκτυπο μιας οντότητας.

NER & Aspect Mining

Name Entity Recognition

Το Name Entity Recognition παρέχει σημασιολογική γνώση πάνω στα δεδομένα που συλλέγονται και σας βοηθά να κατανοήσετε γρήγορα το θέμα του περιεχομένου. Αποτελεί ένα από τα πιο συνηθισμένα σημεία εκκίνησης για τη χρήση τεχνικών επεξεργασίας φυσικής γλώσσας για τον εμπλουτισμό οποιουδήποτε περιεχομένου. Με αυτή την υπηρεσία είναι ευκολότερο να παρέχουμε ακριβέστερη ανάλυση συναισθήματος και να δίνουμε πιο σαφή αποτελέσματα και δυνατότητες αναζήτησης στις υπηρεσίες μας.

 

Aspect Mining

Το Aspect Mining είναι μια τεχνική που αποσκοπεί στον εντοπισμό και την ταξινόμηση επαναλαμβανόμενων θεμάτων ή θεματικών σε διάφορους τύπους περιεχομένου, όπως άρθρα ειδήσεων και αναρτήσεις στα μέσα κοινωνικής δικτύωσης. Μπορεί να χρησιμοποιηθεί για την απόκτηση πληροφοριών σχετικά με τις κοινές πτυχές των κριτικών πελατών και την ταξινόμησή τους με βάση ορισμένα χαρακτηριστικά. Αυτό μπορεί να είναι χρήσιμο για σκοπούς μάρκετινγκ και πωλήσεων και αποτελεί ένα υποπεδίο του opinion mining που επικεντρώνεται στον προσδιορισμό των συγκεκριμένων πτυχών που συζητούνται σε ένα δεδομένο κείμενο.

Content Aggregation & Clustering

Content Aggregation

Η συγκέντρωση και διαχείριση περιεχομένου είναι μια πλήρως αυτοματοποιημένη διαδικασία που περιλαμβάνει τη συλλογή, ανάλυση και οργάνωση πληροφοριών από διάφορες πηγές στο διαδίκτυο, όπως άρθρα ειδήσεων, αναρτήσεις σε ιστολόγια, περιεχόμενο πολυμέσων και σχόλια στα μέσα κοινωνικής δικτύωσης. Η διαδικασία χρησιμοποιεί web crawling, δηλαδή την πρακτική της αυτόματης επίσκεψης ιστότοπων και της εξαγωγής πληροφοριών από αυτούς, καθώς και την ανάλυση περιβάλλοντος και την ομαδοποίηση κειμένου για την ομαδοποίηση παρόμοιου περιεχομένου.

Το σύστημά μας έχει σχεδιαστεί ειδικά για την ανίχνευση big data και το ευρετήριο αναζήτησης που διαθέτουμε είναι ένα από τα μεγαλύτερα στην Ευρώπη. Η διεπαφή χρήστη έχει σχεδιαστεί για να είναι εύχρηστη, με διαισθητικά φίλτρα και δυνατότητες αναφοράς.

Content Clustering

Η ομαδοποίηση περιεχομένου είναι ιδανική για να αξιοποιήσουμε τις ιδιαίτερες τεχνικές και ερευνητικές και αναπτυξιακές ικανότητές της, ώστε να παρέχουμε βελτιωμένα intelligence insights. Λειτουργεί πάνω σε ένα μεγάλο αποθετήριο κειμένων και παράγει ομάδες παρόμοιων κειμένων (συστάδες) που αντιπροσωπεύουν τον τρόπο με τον οποίο ένα γεγονός αναφέρεται από διάφορες πηγές ψηφιακών μέσων ενημέρωσης.

Το Palowise εξετάζει χιλιάδες κείμενα από διάφορες πηγές και τύπους και τελικά τα οργανώνει σε συναφείς συστάδες χρησιμοποιώντας ένα καινοτόμο στατιστικό πλαίσιο που βασίζεται σε ευρέως χρησιμοποιούμενες τεχνικές στην επιστήμη και τη μηχανική. Η συσταδοποίηση έχει αποδειχθεί ότι είναι μια αποτελεσματική τεχνική για την ανάκτηση πληροφοριών αποκαλύπτοντας πολύτιμους πυρήνες πληροφοριών και κατανομές στα υποκείμενα δεδομένα. Ως αποτέλεσμα, μπορεί να παρέχει στα συστήματα ανάκτησης πληροφοριών τη δυνατότητα βελτίωσης της εμπειρίας του χρήστη κατά την περιήγηση και τον γρήγορο εντοπισμό των επιθυμητών πληροφοριών. Στην περίπτωσή μας, συνδυάζουμε κείμενο και δεδομένα από διάφορες πηγές και τύπους και με βάση σταθμισμένα χαρακτηριστικά γνωρίσματα, τα επεξεργαζόμαστε με τρόπο που τελικά επιτρέπει στον χρήστη να διαβάσει μια ολοκληρωμένη κάλυψη ενός θέματος με διαφορετικά επίπεδα ιεραρχίας άρθρων. Όσο περισσότερα δεδομένα έχουμε, τόσο πιο στενά συνδέονται στην ανάλυση και καλύπτουν πλήρως το θέμα.

ICT4Growth project

Το ICT4Growth είναι ένα ερευνητικό έργο που ανέλαβε η Palowise για την ανάπτυξη αλγοριθμικού λογισμικού που τροφοδοτεί την καινοτόμο πλατφόρμα της. Πιο συγκεκριμένα, οι τομείς Ε&Α που στόχευσε και υλοποίησε η Palowise ήταν οι εξής:

Automatic Resource Discovery

Αναπτύξαμε μια αποτελεσματική διαδικασία που εντοπίζει και ανακαλύπτει νέες πηγές πληροφοριών που σχετίζονται με οντότητες όπως εταιρείες και οργανισμούς. Αυτή η διαδικασία, η οποία βρίσκεται σε κορυφαίο επίπεδο, παράγει δεδομένα που μπορούν στη συνέχεια να αναλυθούν με τεχνικές επεξεργασίας φυσικής γλώσσας από άλλες διαδικασίες.

Named Entity Recognition

Η διαδικασία της αποσαφήνισης χρησιμοποιείται για τη διάκριση πραγματικών οντοτήτων, όπως μια συγκεκριμένη εταιρεία ή πρόσωπο, από αναφορές σε κείμενο που δεν σχετίζονται με μια συγκεκριμένη οντότητα. Η διαδικασία αυτή ενισχύει το νόημα οποιουδήποτε περιεχομένου κειμένου με τον εντοπισμό και την επισήμανση αναγνωρισμένων οντοτήτων, καθώς και με την ομαδοποίηση πολλαπλών αναφορών της ίδιας οντότητας κάτω από ένα ενιαίο όνομα. Αυτό βοηθά στην παροχή πιο ουσιαστικών πληροφοριών από αποσπάσματα κειμένου.

Sentiment Analysis

Η ανάλυση συναισθήματος είναι μια τεχνική που χρησιμοποιείται για τον εντοπισμό και την εξαγωγή της υποκείμενης γνώμης ή του συναισθήματος που εκφράζεται σε ένα κομμάτι κειμένου. Μπορεί να αποκαλύψει αν το συναίσθημα που εκφράζεται είναι θετικό, αρνητικό ή ουδέτερο. Η τεχνική αυτή μπορεί να εφαρμοστεί σε οντότητες που προκύπτουν από την αναγνώριση ονομαστικών οντοτήτων, παρέχοντας πρόσθετες πληροφορίες, όπως η συνολική φήμη ενός οργανισμού ή ενός ατόμου ή ο αντίκτυπος ενός συγκεκριμένου γεγονότος που σχετίζεται με την οντότητα. Αυτό βοηθά στην βαθύτερη κατανόηση του πραγματικού περιεχομένου ενός αποσπάσματος κειμένου.

Automatic summarization

Αυτή η διαδικασία περιλαμβάνει την ομαδοποίηση άρθρων που συζητούν το ίδιο θέμα, ομαδοποιώντας τα πρώτα με βάση το περιεχόμενό τους. Με τον τρόπο αυτό, είναι σε θέση να δημιουργήσει μια σύντομη αλλά περιεκτική περίληψη μιας ομάδας άρθρων, παρέχοντας μια γρήγορη επισκόπηση του κειμένου που μπορεί να εκτείνεται σε πολλές παραγράφους. Αυτή η περίληψη είναι σημασιολογικά ακριβής και προσφέρει μια γρήγορη κατανόηση του θέματος.

Aspect Mining

Το aspect mining είναι μια τεχνική που επιτρέπει τον εντοπισμό διαφορετικών προοπτικών ή θεμάτων που υπάρχουν σε κείμενα όπως οι ειδήσεις και τα μέσα κοινωνικής δικτύωσης. Μπορεί να εφαρμοστεί στις οντότητες που εντοπίζονται από την αναγνώριση ονομαστικών οντοτήτων για να αποκαλύψει πληροφορίες σχετικά με συγκεκριμένες οντότητες με τη μορφή διαφορετικών πτυχών ή “απόψεων”.

Οι προαναφερθέντες αλγόριθμοι, σε συνδυασμό με άλλες τεχνολογίες και μια ισχυρή υποδομή, αποτελούν το βασικό πλαίσιο των υπηρεσιών της Palowise. Οι υπηρεσίες αυτές προσφέρουν ένα ευρύ φάσμα δυνατοτήτων, από καινοτόμες εφαρμογές ανάγνωσης ειδήσεων έως εξειδικευμένη ανάλυση της φήμης των εμπορικών σημάτων.

Why Palowise?

  • #1:Use the industry's top artificial intelligence to handle the heavy work for you and gain insights in minutes.
  • #2:Receive an alert if something major occurs near your customer.
  • #3:Identify the influencers, material, and messaging required to generate success in real-time.
  • #4:Manage cross-channel campaigns with multidisciplinary groups and infinite channels.
  • #5:Monitor engagement and sentiment to get valuable insights.
  • #6:Monitor trending topics of discussion among users.

LET’S GROW YOUR BUSINESS TOGETHER.
CONTACT US NOW.