Un scraper Twitter qui dépote
Besoin de scraper des comptes Twitter pour ensuite faire votre petite tambouille et en sortir la meilleure des essences ?
Pas de souci avec Twint !
Cet outil en ligne de commande va vous permettre de récupérer tous les tweets de n’importe quel compte Twitter, sans avoir à vous logger, sans avoir à passer par l’API Twitter et sans aucune limite.
Pour installer Twint :
pip3 install twint
Pour réussir cet exploit, Twint utilise la recherche classique de Twitter et peut ainsi récupérer l’ensemble des tweets d’un compte, ou uniquement ceux contenant le mot clé de votre choix, ou encore ceux qui ont été postés entre telle date et telle date, ou depuis tel ou tel endroit, ou uniquement les retweets. Il est aussi possible de récupérer tous les tweets de tous les comptes Twitter qui mentionnent le mot clé de votre choix. C’est beau !
De quoi vous lancer ensuite dans de l’analyse fine, faire des stats, récupérer des données ou tout simplement garder un backup des comptes Twitter qui vous intéresse.
Voici les commandes utilisables avec Twint :
twint -u username - Scrape all the Tweets from user's timeline. twint -u username -s pineapple - Scrape all Tweets from the user's timeline containing pineapple. twint -s pineapple - Collect every Tweet containing pineapple from everyone's Tweets. twint -u username --year 2014 - Collect Tweets that were tweeted before 2014. twint -u username --since 2015-12-20 - Collect Tweets that were tweeted since 2015-12-20. twint -u username -o file.txt - Scrape Tweets and save to file.txt. twint -u username -o file.csv --csv - Scrape Tweets and save as a csv file. twint -u username --email --phone - Show Tweets that might have phone numbers or email addresses. twint -s "Donald Trump" --verified - Display Tweets by verified users that Tweeted about Donald Trump. twint -g="48.880048,2.385939,1km" -o file.csv --csv - Scrape Tweets from a radius of 1km around a place in Paris and export them to a csv file. twint -u username -es localhost:9200 - Output Tweets to Elasticsearch twint -u username -o file.json --json - Scrape Tweets and save as a json file. twint -u username --database tweets.db - Save Tweets to a SQLite database. twint -u username --followers - Scrape a Twitter user's followers. twint -u username --following - Scrape who a Twitter user follows. twint -u username --favorites - Collect all the Tweets a user has favorited. twint -u username --following --user-full - Collect full user information a person follows twint -u username --profile-full - Use a slow, but effective method to gather Tweets from a user's profile (Gathers ~3200 Tweets, Including Retweets). twint -u username --retweets - Use a quick method to gather the last 900 Tweets (that includes retweets) from a user's profile. twint -u username --resume 10940389583058 - Resume a search starting from the specified Tweet ID.
Amusez-vous bien !