Apps in this workflow

Πώς λειτουργεί

Build your automated pdf to text extractor in a minute! Perfect solution for those who deal with large amounts of incoming CVs or other documents! Extract data from documents using remote workflow on Latenode.com!


In this article you’ll see how to create an automated no code workflow that will extract data from the PDF files on your Google Drive using API and Chat GPT, and filling the Google Sheet form with the data.

Also, you can get the template of that scenario that you can copy and use for yourself for free! 

You can upgrade this template or use it not only for pdf text extraction.

Scenario overview

Let’s take a look at the whole pdf scraper scenario first, and then break each step down.

Illustration of Scenario overview on Latenode

How does this pdf extract scenario work? Once in an hour it takes all the CVs in pdf format from the Google Drive, converts to the txt files using HTTP-request, then chatGPT assistant Extracts the needed data and fills out the Google Spreadsheet.

Main steps of scenario:

  1. Schedule Trigger. Activates the scenario at a set period of time.
  2. Google Drive. Here we have 2 nodes: Find file and Download File.
  3. Javascript. We’ll use Javascript nodes with AI copilot for file formatting throughout the scenario. First, I asked AI to give me code that converts files from Google Drive to base64 format.
  4. HTTP request. Use API to extract text from pdf using tried party services API docs.
  5. ChatGPT.  ChatGPT assistant extracts the data from the text.
  6. Google Sheets. Fills out the sheet with that information,

Scenario breakdown

And here’s a step-by-step instruction for those who want to learn the process. Remember about free to use and ready to go templates at the end of the article.

Preparations

For this scenario, you’ll need to have the ability to use Open AI Assistants and any API converter.

OpenAI assistant

Αυτό είναι απλό. Συνδεθείτε στο λογαριασμό σας στο OpenAI, και στη συνέχεια πηγαίνετε στο βοηθοίκαι κάντε κλικ στο κουμπί "δημιουργία" στην επάνω δεξιά γωνία. Θα δείτε τον πίνακα ρυθμίσεων του βοηθού.

Illustration of AI assistent right settings

Εδώ πρέπει να:

  1. Δώστε ένα όνομα στον βοηθό σας
  2. Δώστε του οδηγίες για το πώς θέλετε να απαντήσει και κάποιο πλαίσιο. Σας συνιστούμε να του ζητάτε να χρησιμοποιεί συνημμένα αρχεία, γιατί διαφορετικά μπορεί να ξεχάσει να το κάνει.
  3. Επιλέξτε ένα μοντέλο
  4. Επιλέξτε τα διαθέσιμα εργαλεία και προσθέστε αρχεία που μπορεί να χρησιμοποιήσει ο βοηθός. Μην ξεχάσετε να ενεργοποιήσετε την ανάκτηση για να είναι δυνατή η προσθήκη αρχείων.

Copy the assistant’s ID (you see it under the Name column), then go to API keys, create one and save it.

PDF to TXT converter

Use any you like. I took ConvertAPI because it has a free trial and provides a lot of info.

Illustration of ConvertAPI app to create automete converter from pdf to text

Create scenario

Now we switch to Latenode.com. Here, we have to create the pdf to text conversion scenario: (You don't need to create it from scratch, just copy the template at the end of the article)

Σκανδάλη χρονοδιαγράμματος

Illustration of schedule trigger

Click “Add node” in the scenario tab, choose “Schedule” from the list. Click on the node to set it up. Specify the interval and the timezone, save the changes. I also added a trigger on Run once, just for convenience.

Google Drive nodes

Illustration of Google Drive nodes

Click “Add node”, search for Google drive folder in actions tab, and choose “Find file” node.
To make it work you have to log into gmail account to get access token, choose drive and Search name. In this case, I want to extract data from files that have CV in their name.

Next add “Download file” from the same action folder of Google drive.

Illustration how to download file you need to create AI pdf-text converter

Use id from the results of the previous node, and then click run node once to save the changes and make the data flow through the scenario. You’ll get the file in the output.

Javascript #1: Convert to base64

Illustration of JS code you need To extract Text

That is the code the AI gave me. You can take it here(#1). Replace const fileContentPath with your object from the previous node.

Αίτημα HTTP

Find HTTP request in the list of actions. To understand how to create it, visit ConvertAPI documentation. Here we can take info about setting up the request.

Here’s how my pdf to txt conversion request looks like.

Illustration of right HTTP reques settings

I use an object from Find file Google Drive node to specify the name of the downloaded file, and file content in base64 from the Javascript node. And add Content-Type=application/json pair in Headers.

Illustration of right HTTP reques settings

Run node once to get the file from the HTTP request.

Javascript #2

Illustration of JS code you need To extract Text

Another code node, #2 here.

This time, I asked AI to extract text from the txt file.

ChatGPT nodes

We’ll face 3 GPT nodes here:

  • Create Thread
  • Create Message
  • Δημιουργία εκτέλεσης

 Each node performs an action with OpenAI.

First we create a thread, or conversation with the GPT Assistant

Illustration how to create ChatGPT nodes and how to use AP key

Insert your Open AI API key, that’s it! Run node once and get the id of the created thread in the output.

Create message:

illustration how to create right massage for AI Support Assistent

Here you need an API key again. In the thread ID field put the result of the previous node. You’ll see it in the helper window after you click on the input field.

In “Message content” give some additional instructions if you want and put the filecontent from the last Javascript node. Automated pdf extractor is one step closer!

Δημιουργία εκτέλεσης

Illustration How to create your run to watch the result

This node gets the pdf scraper reply.

Specify the node just like your OpenAI assistant and use GPT assistant ID.

Javascript #3

Illustration of JS code you need To extract Text

Here we use JS node the last time, to make 3 separate json objects out of the Assistants reply.

Here’s the example, just put your data in content const.

Φύλλα Google

Let’s put this data somewhere, Google Sheets is a good option for this pdf data extract scenario on latenode.com.

illustration of Google Sheets settings you need

Log into gmail account once more to get access token, choose the drive and the sheet, and put jsons into the fields, save the scenario and click run once to run or deploy the scenario to activate the schedule trigger.

Results

The reslts of work we have done

After a successful scenario execution this workflow will extract the text from pdf file on your Google Drive and put it into your Google Spreadsheet.

That is how to create a pdf extractor with no code on latenode.

As I promised, here’s the template of this workflow. Just copy it and follow this guide article to set it up.

There’s a video about it, don’t bother reading!

If you want somebody to help you, check out our Discord channel, we have some devs in it ready to assist!

Categories

AI
IT & Development
Διαφήμιση & Μάρκετινγκ

ΣΥΧΝΈΣ ΕΡΩΤΉΣΕΙΣ

Μπορώ να χρησιμοποιήσω το Latenode αν δεν είμαι εξοικειωμένος με τον προγραμματισμό;

Ναι, το Latenode έχει σχεδιαστεί για χρήστες όλων των επιπέδων δεξιοτήτων. Προσφέρει προηγμένα χαρακτηριστικά για όσους είναι γνώστες της JavaScript και διαισθητικά οπτικά εργαλεία και βοήθεια τεχνητής νοημοσύνης για αρχάριους. Είτε είστε έμπειρος προγραμματιστής είτε αρχάριος, το Latenode παρέχει μια φιλική προς το χρήστη εμπειρία προσαρμοσμένη στο επίπεδο δεξιοτήτων σας.‍‍

Μπορεί το Latenode να ενσωματωθεί με υπηρεσίες και API τρίτων;

Ναι, το Latenode υποστηρίζει την ενσωμάτωση με ένα ευρύ φάσμα υπηρεσιών και API τρίτων. Μπορείτε να συνδέσετε το Latenode με διάφορες διαδικτυακές πλατφόρμες, βάσεις δεδομένων και συστήματα λογισμικού για την αυτοματοποίηση της μεταφοράς δεδομένων, την ενεργοποίηση ενεργειών και τον εξορθολογισμό των ροών εργασίας. Το Latenode παρέχει επίσης εργαλεία και πόρους για τη διευκόλυνση της διαδικασίας ολοκλήρωσης.

Υπάρχει διαθέσιμη δωρεάν έκδοση του Latenode ;

Ναι, το Latenode προσφέρει μια δωρεάν έκδοση που σας επιτρέπει να εξερευνήσετε τις δυνατότητές του. Αυτή η έκδοση περιλαμβάνει ένα υποσύνολο των δυνατοτήτων του Latenode, επιτρέποντάς σας να ξεκινήσετε με την αυτοματοποίηση και να βιώσετε τα οφέλη της. Στη συνέχεια, μπορείτε να αποφασίσετε αν θα αναβαθμίσετε σε ένα επί πληρωμή πρόγραμμα για πρόσθετες δυνατότητες και πόρους.

Τι είναι το Latenode?

Latenode είναι ένα ορατό και διαισθητικό εργαλείο αυτοματοποίησης που έχει σχεδιαστεί για να δίνει τη δυνατότητα στους πελάτες να βελτιώσουν τις ροές εργασίας τους μέσω της αυτοματοποίησης. Επιτρέπει στους πελάτες να δημιουργούν μηχανογραφημένες στρατηγικές μέσω της σύνδεσης διαφορετικών προσφορών στο διαδίκτυο και συσκευών, επιτρέποντάς τους να αυτοματοποιούν τις υποχρεώσεις και να διακοσμούν με επιτυχία την παραγωγικότητα.

How does Latenode help maximize opportunities?

By integrating all your marketing tools in one place through data integration, Latenode helps you gain a comprehensive view of your operations. This enables you to identify potential opportunities more easily and make informed decisions based on accurate data.