Skip to main content
  1. Kurser ✍️/

📈 Kursus — Sådan får du værdifulde 💎 data 💎 ud af tekst

Med kunstig intelligens er det blevet muligt at lave værdifulde analyser af store mængder tekst - men hvordan gør man?

Vi opfatter normalt tekst og data som to forskellige ting.

Men med kunstig intelligens er det blevet muligt at lave analyser på store mængder tekst meget effektivt.

Kvantitativ tekstanalyse handler om at trække data ud af ustruktureret tekst, det kan også være almindelig samtale eller kommunikation på skrift, og omsætte den til data på en mere struktureret form.

tekst
For os er det sekvenser af ord der giver mening. Kunstig Intelligens som det som sekvenser af tokens.
data
Målte, udledte eller oberverede værdier, som regel i talformat men data kan også være kategoriske.

Hvad er datatyper? #

Inden for informationsteknologien har den datatype som ligger tættest på almindelig dagligdags tekst længe haft et navn. Men kalder det en string - altså en tekststreng.

Type Example
Integers -65535
Decimals (floats) 9.9999, Infinity
Strings “hole 18”, ‘hole 18’, `hole 18`, hole18
Booleans true
Dates 2000-01-01
Durations 2min + 12sec
File sizes 64mb
Ranges 0..4, 0..<5, 0.., ..4
Binary 0x[FE FF]

Strukturering af data #

Struktur Eksempel
Lists [0 1 'two' 3]
Records {name:"Nushell", lang: "Rust"}
Tables [{x:12, y:15}, {x:8, y:9}], [[x, y]; [12, 15], [8, 9]]
Closures {|e| $e + 1 | into string }, { $in.name.0 | path exists }
Blocks if true { print "hello!" }, loop { print "press ctrl-c to exit" }
Null null
Lennart Kiil

Lennart Kiil

Særligt kendskab til kvantiativ sproganalyse og LLMer