Tisztelt Lista!
Szeretném felhívni a figyelmet egy sok éve fejlesztett szövegesinformáció
feldolgozó program új változatára, amely már automatikusan kezeli a magyar
toldalékos alakokat, összetett szavakat.
Ezeket a szótári alakokat köti az egyes szövegekhez (bekezdésekhez), amelyeket
azután e szótári alakokból épített hierarchikus fogalmi háló segítségével
lehet megtalálni.
(Frissült a honlapom, idézet az ismertetésből:)
StaTOR free 2.1.38 - (Stemming BETA v01)
Szövegesinformáció-kezelő automatikus szótövezéssel.
Az adatbázis szerkezete lehet hálós, hierarchikus, vagy fa, akár mindezek
egyszerre is.
Automatikus szótövezés (kb. 90 %-os hatékonysággal, magyar nyelvű).
Az információk tartalom szerinti visszakeresése.
Új!
Ez már a 2.1.38-as változat javításokkal, bővítésekkel.
Most már Windows XP mellett Vista alatt is működik.
Zip telepítő file.
A free termékváltozat befogadóképessége az ötszörösére növekedett a StaTOR
2.1.37 előtti változatokhoz képest.
Új!
A StaTOR szöveges információk tartalom szerinti tárolására, rendezésére,
feldolgozására és visszakeresésére készült. Segíti megőrizni mindazt, amit
tudunk, vagy mások tudnak, és e tudást könnyen rendszerezhetjük,
átdolgozhatjuk, visszakereshetjük.
A program használatának előnyei:
- A szöveges információk tartalom szerinti - 90 %-ban automatikus -
besorolása.
- Az információk tartalom szerinti visszakeresése, amit a kulcsfogalmakból
építhető váz tesz lehetővé. A szövegek már említett információ tartalom
szerinti elő-feldolgozása biztosítja az azonnali - tartalom szerinti -
információ elérést az egész adatbázisra vonatkozó tényleges keresés nélkül.
- A keresés tartalom szerinti, ami lehetővé teszi - egyszeri definiálás
után,
egy gyűjtő fogalom, fő fogalom segítségével - a szinonimákat, idegen nyelvű
megfelelőket, a szakmai szleng kifejezéseit, ragozott, vagy elírt alakokat
tartalmazó szövegek megtalálását is.
- Az adatbázis szerkezete egyszerre lehet hálós és hierarchikus, vagy fa,
mindez dinamikusan változtatható, alakítható.
- A tárolt szövegek (egyszerre) a legkülönbözőbb szempontok szerint
csoportosíthatók, pl. a forrása, kiadás időpontja, helye, szerzője, témája,
nemzetisége, műfaja, és bármilyen szempont szerint, mely szempont valakinek
valamilyen ok miatt fontos, vagy fontos lehet.
- A szövegek és a kulcsfogalmak, kiemelt szavak közötti új kapcsolat megmarad,
így az adatbázis egy-egy keresés, kigyűjtés után rendezettebbé válik,
"okosodik".
- Parancs sorokkal adatrekordok mezőinek automatikus láncolása is elvégezhető
(sok más funkció mellett).
- Az adatbázisban a szöveges objektumok (fogalmak, szövegek, parancs sorok)
csak logikailag vannak elkülönítve, kezelésük teljesen azonosan történik.
- Egyszerű, egy 5 oldalas leírás segítségével hónapokig lehet vele dolgozni.
A program már nagyon sok funkciót tartalmaz jól kidolgozva, a mostani
szótövező rész is majd még további pontosításra kerül. (Most kb. 90 %-át
ismeri fel egy átlagos internetes honlap szövegének.)
Nyelvészeti szempontból még számos hibát rejt a szótövező, de a gyakorlatban
sokat segít, megkímél az eddigi kézi szótő megadások legnagyobb részétől,
az
összetett szavakat pedig jobban felbontja, mint az tettem eddig én magam.
Akit érdekel, a honlapomról letöltheti a free változatot, amelynek befogadó
képessége 10.000 db szöveg, amelyek egyenként max. 32.000 karakter hosszúak
lehetnek.
A futtatáshoz szükséges: Windows XP vagy Vista operációs rendszer, Pentium
kompatibilis processzor, kb. 50 MB szabad hely a merevlemezen a program
és
a
demó adatbázisok részére.
Telepítő file (34,5 MB)
http://www.stator.hu/download/SetupStaTORfree.WithDemoDatabase.zip
Üdvözlettel
Torma István
Cap
TOR Gondolatorientált Szoftver - szövegesinformáció-feldolgozás:
http://www.stator.hu/
|
Kedves Károly és a Nyelv minden olvasója!
Osztom Hajba Károly fenntartásait. A cikkemben felsorolt
négy különböző elképzelést csak annak érzékeltetése végett
gyűjtöttem csokorba, (hármat közülük immár harmadszor a
HIX-en), hogy még mennyire nem bizonyított a Bécs szó
eredete.
Tovább kutatgattam és tudományosan hiteles értekezésre
akadtam, sajnos csak német nyelven:
http://tinyurl.com/3p8yco
Az értekezésben a Hamburgi Egyetem (1950-ben született és
tavaly elhúnyt) Eugen Helimski nagytekintélyű, tudós finn-
ugrisztika professzora vaslogikával vezeti le azon következtetését,
hogy a Bécs név eredete a latin 'Vindobona' alakban keresendő:
Vindobona (~ Vendobona stb.) >> *Bind-, Bend- (vagy
*Vindia) >> szláv *Bedj >> Bécs.
A levezetés (szerintem brilliáns) részletei végett el kell olvasni
a cikket, sajnos, most nincs időm arra, hogy lefordítsam.
A neves professzor érvelése tudományosan (a jól ismert
fonetikai törvényszerűségekhez hűen) megalapozott, magam
is úgy gondolom, hogy -- bármennyire is meglepő --
ez a legvalószínűbb magyarázat.
Balázs írta Stockholmból
|