Competence Meet-up Web & Software Development: fastText

30 november 2018

Afgelopen woensdag stond er weer een Competence Meet-up Web & Software Development op het programma, met deze keer fastText als thema. 

FastText is een open source Natural Language Processing library, welke specifiek door Facebook ontworpen is om met (hun) grote hoeveelheden data om te kunnen gaan. Door middel van Natural Language Processing (NLP) kan Facebook op computerniveau beter begrijpen wat men op het platform post en bijvoorbeeld verkeerd taalgebruik of verboden content weren. FastText wordt dus gebruikt om teksten te classificeren, woorden te herkennen en zinnen te ontleden. Het helpt daarnaast om bestaande modellen sneller te trainen dan met reeds bestaande libraries. Het biedt daarnaast een veelvoud aan ondersteunde talen en support voor analogieën. 

Onze collega Ferenc, Front End Development expert, gaf een presentatie aan onze collega's, waarin hij uitlegde wat tekst classificatie en NLP is en wat de voordelen van fastText zijn.

IMG 0004

Na een uitgebreide uitleg over hoe het trainen van een tekst classificatie model werkt en wiskundige formules kregen we een aantal praktijkvoorbeelden voorgeschoteld (letterlijk en figuurlijk). Ferenc had hiervoor de website Smulweb gecrawld om uiteindelijk het getrainde model te laten herkennen of een recept Italiaans, Nederlands of iets anders is. Het was leuk om te zien dat je met een klein stukje tekst al kan achterhalen van wat voor type recept het een onderdeel is.

IMG 0002

Uiteindelijk zijn we zelf ook achter de knoppen gaan zitten en hebben we gespeeld met een set data met IMDB reviews. Het idee hiervan was om te achterhalen wanneer een review goed of slecht was. Naar mate je het model meer traint leert het steeds meer over welke woorden goed en fout zijn maar ook bepaalde zinsconstructies kunnen daarbij een rol spelen. Het werd aan het einde natuurlijk de kunst om het model voor de gek te houden door een zin zo te formuleren dat het model het als slecht bestempeld terwijl het goed zou moeten zijn.

IMG 0005

Het was een erg leerzame Meet-up en gaf een leuke kijk op hoe dit gebruikt kan worden en wat de toekomst gaat bieden hierin. Ferenc, bedankt voor de voorbereidingen en de interessante en leerzame presentatie!

naar overzicht

Wilt u reageren of meer weten?

Heeft u iets in dit artikel gelezen dat uw interesse gewekt heeft? Laat het ons weten!

Trotse winnaar van een
FD Gazellen Award
2014 t/m 2018

© 2018 | Europalaan 12a | 5232BC 's-Hertogenbosch | T: +31 (0)85 0290550 | E: info@pancompany.com