Neuronové sítě ve statistickém programu. Jaký je rozdíl mezi neuronovými sítěmi a statistikami? Seznam algoritmů učení

Tyto knihy lze zakoupit v kanceláři StatSoft.

Populární úvod do moderní analýzy dat a strojového učení na Statistice

V.P. Borovikov

Objem: 354 stran.

Cena: 1000 rublů.

Moderní možnosti analýzy dat a strojové učení, což je trend v moderní počítačové analýze. Prezentace klade důraz na pochopení metod a jejich aplikaci na praktické problémy. "Následujte nás a naučíte se analyzovat data!" - hlavní leitmotiv knihy.

Klasické statistické metody jsou podrobně popsány, včetně vícerozměrných metod: shluková analýza, diskriminační analýza, vícenásobná regrese, faktorová analýza, analýza hlavních složek, analýza přežití a Coxova regrese. Samostatné kapitoly pokrývají metody neuronových sítí, metody dolování dat, klasifikační a regresní stromy (modely CART). Jsou uvažovány příklady z různých oblastí lidské činnosti: průmysl, maloobchod, infokomunikace, obchod, medicína. Speciální kapitoly jsou věnovány teorii pravděpodobnosti a optimalizačním metodám, které jsou základem metod strojového učení.

Pro široké spektrum čtenářů: inženýry, technology, manažery, analytiky, lékaře, výzkumníky se zájmem o moderní analytické metody a technologie pro analýzu dat a strojové učení a jejich aplikaci v praxi.

Populární úvod do analýzy dat moderních systémů STATISTIKA

V.P. Borovikov

Objem: 288 stran.

Jedinečná kniha vědeckého ředitele StatSoft Vladimira Borovikova obsahuje vše nejlepší, co je v oblasti analýzy dat známo.

Na jednoduchých, jasných příkladech z obchodu, marketingu a medicíny jsou popsány moderní metody analýzy dat - vizuální analýza a grafická prezentace dat, deskriptivní statistika, klasifikační a prognostické metody.

Kniha je vzdělávacím standardem v oblasti analýzy dat na předních univerzitách v Rusku: MIEM HSE, Moskevská státní univerzita, Kuban Státní univerzita atd.

Velká pozornost je věnována systematice analýzy dat, od deskriptivní analýzy, čištění a ověřování dat, vizuální prezentace, seskupování a klasifikačních metod až po nejnovější technologie neuronové sítě a data mining, který vám umožní najít vzory ve vašich datech.

Teorie pravděpodobnosti, matematická statistika a analýza dat: Základy teorie a praxe na počítači. STATISTIKA. VYNIKAT. Více než 150 příkladů řešení problémů

Khalafyan A.A., Borovikov V.P., Kalaidina G.V.

Objem: 320 stran.

Cena: 600 rublů.

Přihlášku můžete zaslat na:

Současná úroveň rozvoje výpočetní techniky umožňuje posunout studium teorie pravděpodobnosti a matematické statistiky na novou vzdělávací úroveň se zaměřením na aplikovanou část disciplíny - matematickou statistiku a počítačovou analýzu dat.

Učebnice nastiňuje prvky kombinatoriky, různé cesty jsou uvedeny výpočty pravděpodobností, pojmy náhodné veličiny, její funkční a číselné charakteristiky. Teoretický materiál je doprovázen příklady a speciálně vybranými úkoly, které umožňují prostudovat látku do hloubky. Samostatná kapitola popisuje použití Excelu a STATISTIKA pro řešení aplikovaných problémů. Excel je součástí Microsoft Office a dnes je jednou z nejpopulárnějších aplikací na světě. STATISTIKA zaujímá přední místo mezi programy pro analýzu dat, má více než milion uživatelů po celém světě. Program je kompletně rusifikován, byl vytvořen Intellectual knowledge portal, který představuje globální multimediální zdroj pro široké spektrum uživatelů: školáky, studenty, postgraduální studenty – každého, kdo chce rozvíjet svůj intelekt, seznámit se s moderní technologie počítačová analýza dat.

Učebnice je určena širokému spektru studentů a učitelů, studentů, bakalářů humanitních a přírodních věd nematematických oborů, studujících vyšší matematiku.

Neuronové sítě STATISTICA Neuronové sítě: Metodika a technologie moderní analýzy dat

Ed. V.P. Boroviková

Rozsah: 392 stran.

Přihlášku můžete zaslat na:

Kniha nastiňuje metody neuronové sítě analýzy dat založené na použití balíčku STATISTICA Neuronové sítě, plně přizpůsobený pro ruského uživatele.

Jsou uvedeny základy teorie neuronových sítí; velká pozornost je věnována řešení praktických problémů, komplexně je zvažována metodika a technologie provádění výzkumu pomocí balíčku STATISTICA Neuronové sítě– výkonný nástroj pro analýzu dat, budování závislostí, prognózování, klasifikaci.

V současné době jsou neuronové sítě intenzivně využívány v bankovnictví, průmyslu, marketingu, ekonomice, medicíně a dalších oblastech, kde je vyžadována prognóza a hluboké porozumění datům. Obecně se uznává, že neuronové sítě jsou přirozeným doplňkem klasických metod analýzy a používají se tam, kde standardní postupy nedávají požadovaný efekt.

Kniha obsahuje mnoho příkladů analýzy dat, praktická doporučení pro analýzu, prognózování, klasifikaci, rozpoznávání vzorů a řízení výrobních procesů pomocí neuronových sítí.

Kniha bude užitečná pro široké spektrum čtenářů zabývajících se výzkumem v bankovnictví, průmyslu, obchodu, geologickém průzkumu, managementu, dopravě a dalších oblastech.

STATISTIKA: Umění analýzy dat na počítači (2. vydání)

+ Multimediální učebnice StatSoft

V. P. Borovikov

Objem: 700 stran.

Kniha je momentálně vyprodaná. V blízké budoucnosti se plánuje nové vydání knihy. Přihlášky prosím zasílejte na:

Kniha je nejzákladnějším textem o moderní analýze dat a obsahuje přibližně 700 stran popisů metod a postupů analýzy dat. Druhé vydání knihy bylo doplněno o nové materiály, které nebyly obsaženy v předchozí verzi knihy, zejména: je popsána výkonová analýza, odhad velikosti vzorku, dílčí korelace, analýza hlavních komponent, nová interpretace neuronových sítí dané, a mnoho dalšího. Kniha je dodávána s CD, na kterém najdete demoverze. softwarových produktů StatSoft, příklady analýzy dat, slavná elektronická učebnice StatSoft, učebnice průmyslové statistiky, materiály školicích kurzů a také obrovské množství dat pro školení a nezávislý výzkum.

Hlavním rysem druhého vydání je nová kapitola o jazyce STATISTIKA Visual Basic (SVB), který rozšiřuje možnosti systému STATISTIKA a umožňuje uživatelům vytvářet vlastní aplikace.

Na příkladu reálných dat kniha podrobně popisuje základní koncepty analýzy dat v systému. STATISTIKA: popisná a vizuální analýza, analýza kontingenčních tabulek, budování vztahů, vícenásobná regrese, analýza přežití, neparametrické metody, korespondenční analýza, neuronové sítě, klasifikace a predikce pomocí neuronových sítí, kontrola kvality, experimentální design, včetně široké škály návrhů a mnoho dalšího .

Zvláštností knihy je, že výsledky analýzy nejen vidíte, ale můžete je po nás v systému opakovat STATISTIKA S využitím nejnovějších technologií počítačové analýzy dat od StatSoft se tedy krok za krokem naučíte analyzovat a rozumět datům.

Tato zásadní publikace je určena nejširšímu okruhu čtenářů a uživatelů systému STATISTIKA kteří se chtějí stát profesionály v analýze dat v různých oblastech: obchod, marketing, finance, management, ekonomika, průmysl, pojišťovnictví, lékařství a další aplikace.

Předvídání v systému STATISTIKA v prostředí WINDOWS

V.P. Borovikov, G.I. Ivčenko

Objem: 368 stran.

Kniha je momentálně vyprodaná.

Tajemství předpovědí z první ruky.

Zvláštností knihy je spojení dvou vzájemně souvisejících a vzájemně se doplňujících částí: praktické, která podrobně popisuje, s překlady hlavních voleb a dialogových oken, prognózování v moderní verzi systému STATISTIKA, a teoretická, která nastiňuje hlavní myšlenky, metody a výsledky teorie stochastického prognózování.

Syntéza teorie a praxe by podle autorů měla vést k tomu, že si čtenář metody a techniky prognózování nejen mechanicky osvojí, ale získá jim související porozumění: od obeznámení se s matematickými základy až po získání praktických dovedností. v systému STATISTIKA.

Kniha vychází z kurzu autorů na Moskevském státním institutu elektroniky a matematiky (MGIEM - Technická univerzita). Aplikace obsahuje obsáhlý anglicko-ruský slovník základních prognostických termínů.
Kniha je určena vědcům, analytikům a specialistům, kteří využívají prognostické metody v každodenních činnostech, a mohou ji využít i učitelé vysokých škol při výuce kurzů prognózování a matematické statistiky.

Geostatistika. Teorie a praxe

V.V. Demjanov, E.A. Saveljevová

Objem: 327 stran.

Kniha je momentálně vyprodaná.


Tato kniha odpoví na otázky:
- co je geostatistika?
- jaké metody prostorové interpolace existují?
- co je kriging?
- Jak je variogram užitečný?
- proč potřebujeme stochastické modelování?
a mnoho dalších

Monografie podrobně popisuje metody geostatistiky a související oblasti prostorového modelování. Prezentaci teorie doprovázejí příklady použití modelů v různých oblastech: ekologie, geologie, hydrogeologie, těžba ropy, energetika, hodnocení rybolovu atd. Závěrečná část nastiňuje hlavní směry vývoje moderní geostatistické teorie. Publikaci lze využít jako učební pomůcku.

Materiál v knize je prezentován s postupnými komplikacemi. Jsou zde otázky a cvičení k upevnění získaných znalostí. Kniha obsahuje přílohy, které ji umožňují použít jako referenční knihu o geostatistike.


StatSoft Data Analysis Academy také nabízí širokou škálu kurzů o moderních metodách a technologiích pro analýzu dat v oblasti geoanalytiky.

Průmyslová statistika. Kontrola kvality, analýza procesů, plánování experimentů v balíku STATISTIKA

Khalafyan A.A.

Objem: 384 stran.

Kniha je momentálně vyprodaná.


Tato publikace je věnována popisu statistických metod, které umožňují při omezeném množství analyzovaných výrobků posuzovat stav kvality vyráběných výrobků s danou mírou přesnosti a spolehlivosti. Statistická analýza kvality produktů zajišťuje přijetí správných manažerských rozhodnutí nikoli na základě intuice, ale pomocí vědeckých metod identifikace vzorů v nashromážděných polích číselných informací.

Učebnice pokrývá takové části průmyslové statistiky, jako jsou: karty kontroly kvality; procesní analýza; šest sigma; plánování experimentů ve světoznámém balení STATISTIKA. Dáno Detailní popis technologie pro práci s programovými moduly.

Publikace je určena studentům oborů "Ekonomika", "Management jakosti", "Standardizace a metrologie", "Metrologie, normalizace a certifikace", postgraduálním studentům, výzkumným pracovníkům, vysokoškolským učitelům, analytikům a manažerům a všem zájemcům ve statistických metodách řízení kvality .

Jak vyhrát mistrovství světa. Metody matematické statistiky v řízení národního fotbalu

Petrunin Yu.Yu., Rjazanov M.A.

Objem: 56 stran.

Kniha je momentálně vyprodaná.


Moderní metody statistiky a analýzy dat vedly ke vzniku nových vědních disciplín - fotbalonomie a fotbalometrie. Pomocí v nich vyvinutého aparátu je možné hodnotit kvalitu práce státních (Ministerstvo sportu) i neziskových organizací (fotbalové svazy a svazy), rozvíjet a uplatňovat metody regulačního vlivu, které mohou zvýšit úroveň národního fotbalu. a její prestiž na světové scéně.

STATISTIKA- Rychlý návod

Objem: 250 stran.

Kniha je momentálně vyprodaná.

Kniha nastiňuje základní principy práce se systémem, probírá panely nástrojů, uživatelské rozhraní, datové soubory a praktické příklady použití balíčku. Samostatná kapitola je věnována nastavení systému. Kniha také obsahuje obsáhlou referenční příručku, která poskytuje stručné informace o nejčastěji používaných konvencích, funkcích a možnostech systému STATISTIKA a předmětový rejstřík.

  • Pre- a post-processing, včetně výběru dat, nominálního kódování, škálování, normalizace, odstranění chybějících dat s interpretací pro klasifikaci, regresi a problémy s časovými řadami;
  • Výjimečně snadné použití plus bezkonkurenční analytický výkon; například nemá žádné analogy Průvodce řešením provede uživatele všemi fázemi vytváření různých neuronových sítí a vybere tu nejlepší (tento úkol se jinak řeší dlouhým procesem „pokusů a omylů“ a vyžaduje důkladnou znalost teorie);
  • Výkonný průzkum a analytické technologie , počítaje v to Analýza hlavních komponent A Redukce rozměrů pro výběr potřebných vstupních proměnných při exploratorní (neuronové síti) analýze dat (výběr potřebných vstupních proměnných pro neuronové sítě často trvá dlouho; systém STATISTICA Neuronové sítě může tuto práci provést za uživatele);
  • Nejpokročilejší, optimalizované a výkonné algoritmy síťového tréninku (včetně konjugovaného gradientu a Levenberg-Marquard); plná kontrola nad všemi parametry ovlivňujícími kvalitu sítě, jako jsou aktivační a chybové funkce, složitost sítě;
  • Podpora pro soubory neuronových sítí a architektur neuronových sítí téměř neomezené velikosti, vytvořené v Síťové sady - Síťové sady; selektivní trénování segmentů neuronové sítě; kombinování a ukládání sad sítí samostatné soubory;
  • Plná integrace se systémem STATISTIKA; všechny výsledky, grafy, zprávy atd. lze dále upravovat pomocí výkonných grafických a analytických nástrojů STATISTIKA(například pro analýzu předpokládaných reziduí, vytvoření podrobné zprávy atd.);
  • Bezproblémová integrace s výkonnými automatizovanými nástroji STATISTIKA; nahrávání plnohodnotných maker pro jakoukoli analýzu; vytváření vlastních analýz neuronových sítí a aplikací pomocí STATISTICA Visual Basic, výzva STATISTICA Neuronové sítě z jakékoli aplikace, která podporuje technologie COM(například automatická analýza neuronové sítě v tabulce MS Excel nebo kombinací několika vlastních aplikací napsaných v C++, C#, Java atd.).


STATISTICA Neuronové sítě v neuronové síti:

  • Použití neuronových sítí zahrnuje mnohem více než pouhé zpracování dat pomocí metod neuronových sítí.
  • STATISTICA Neuronové sítě poskytuje různé funkčnost, pro práci s velmi složitými úkoly, včetně nejen těch nejnovějších Architektury neuronových sítí A Algoritmy učení, ale také nové přístupy v Výběr vstupních dat A Budování sítě. Kromě toho vývojáři software a uživatelé experimentující s nastavením aplikace ocení skutečnost, že po provedení specifikovaných experimentů v jednoduchém a intuitivním rozhraní STATISTICA Neuronové sítě Analýzy neuronových sítí lze kombinovat do vlastní aplikace. Toho je dosaženo buď pomocí knihovny Funkce STATISTICA COM, který plně odráží veškerou funkčnost programu, nebo pomocí kódu v jazyce C (C++, C#) nebo Visual Basic, který je generován programem a pomáhá provozovat plně trénovanou neuronovou síť nebo síťový soubor.

Počáteční údaje

Modul STATISTICA Neuronové sítě plně integrován do systému STATISTIKA K dispozici je tak obrovský výběr nástrojů pro úpravu (přípravu) dat pro analýzu (transformace, podmínky pro výběr pozorování, nástroje pro kontrolu dat atd.). Jako všechny testy STATISTIKA, lze program „připojit“ ke vzdálené databázi pomocí nástrojů pro zpracování na místě nebo propojit s živými daty, takže modely jsou trénovány nebo spouštěny (např. pro výpočet předpokládaných hodnot nebo klasifikaci) automaticky, kdykoli se data změní.

Výběr vstupu a redukce rozměrů

Poté, co jsou data připravena, musíte se rozhodnout, které proměnné se mají použít při práci s neuronovou sítí. Čím větší počet proměnných, tím složitější neuronová síť bude, a proto bude vyžadovat více paměti a tréninkového času a také větší počet trénovacích příkladů (pozorování). Pokud nejsou k dispozici dostatečná data a/nebo korelace mezi proměnnými, stává se v mnoha aplikacích neuronových sítí otázka výběru smysluplných vstupních proměnných a komprimace informací do menšího počtu proměnných nanejvýš důležitá.


Algoritmy redukce rozměrů:

  • V STATISTICA Neuronové sítě Byly implementovány inverzní a přímé algoritmy výběru krok za krokem. Kromě toho neurogenetický algoritmus pro výběr vstupních dat kombinuje schopnosti genetických algoritmů a PNN/GRNN (PNN - pravděpodobnostní neuronové sítě, GRNN - zobecněné regresní neuronové sítě) Pro automatické vyhledávání optimální kombinace vstupních proměnných, a to i v případech, kdy mezi nimi existují korelace a nelineární závislosti. Téměř okamžitá rychlost učení Algoritmus PNN/GRNN nejen umožňuje uplatnit Neuro-Genetic algoritmus pro výběr vstupních dat, ale také vám umožňuje (pomocí dostupných Editor systémová data STATISTICA Neuronové sítě vhodné prostředky k potlačení nevýznamných proměnných) provádějte své vlastní experimenty s citlivostí dat v reálném čase. STATISTICA Neuronové sítě obsahuje také vestavěný systém Analýza hlavních komponent (PCA a asociativní sítě pro "nelineární PCA"), což umožňuje zmenšit rozměr zdrojových dat. Všimněte si, že v základním systému je k dispozici velké množství statistických metod pro snížení dimenzionality dat STATISTIKA.


Měřítko dat a převod nominální hodnoty:

  • Před vložením dat do sítě je třeba je určitým způsobem připravit. Stejně důležité je, aby výstupní data mohla být správně interpretována. V STATISTICA Neuronové sítě je možné automaticky škálovat vstupní a výstupní data (včetně škálování podle minimálních/maximálních hodnot a podle průměru/směrodatné odchylky); Proměnné s nominálními hodnotami lze také automaticky překódovat (například Gender=(Muž,Žena)), včetně použití metody kódování 1-of-N. STATISTICA Neuronové sítě obsahuje také nástroje pro práci s chybějícími daty. Realizované normalizační funkce jako např "jednotlivá částka", "vítěz bere vše" A "vektor jednotkové délky". Existují nástroje pro přípravu a interpretaci dat speciálně navržené pro analýzu časových řad. V základním systému je také implementována široká škála podobných nástrojů STATISTIKA.
  • V klasifikačních problémech je možné nastavit intervaly spolehlivosti, které STATISTICA Neuronové sítě se pak používá k přiřazení pozorování k jedné nebo druhé třídě. V kombinaci se speciální implementovanou v STATISTICA Neuronové sítě aktivační funkce Softmax a křížové entropické chybové funkce, to poskytuje základní pravděpodobnostní teoretický přístup ke klasifikačním problémům.

Výběr modelu neuronové sítě, Síťové soubory

Různorodost modelů neuronových sítí a mnoho parametrů, které je třeba nastavit (velikost sítě, parametry učícího algoritmu atd.) mohou některé uživatele zmást (proto existuje Průvodce řešením, který dokáže automaticky vyhledat vhodnou síťovou architekturu libovolné složitosti).


Systém STATISTICA Neural Networks implementuje všechny hlavní typy neuronových sítí používaných při řešení praktických problémů, včetně:

  • vícevrstvé perceptrony (sítě s přímým přenosem signálu);
  • sítě založené na funkcích radiální báze;
  • samoorganizující se Kohonenovy mapy;
  • pravděpodobnostní (Bayesovské) neuronové sítě;
  • zobecněné regresní neuronové sítě;
  • sítě hlavních komponent;
  • sítě pro shlukování;
  • lineární sítě.
Také v systému STATISTICA Neuronové sítě implementováno Síťové soubory, vytvořené z náhodných (ale významných) kombinací výše uvedených sítí. Další užitečnou funkcí je, že můžete propojit sítě dohromady tak, aby běžely sekvenčně. To je užitečné při předběžném zpracování k nalezení řešení s minimálními náklady.

V balení STATISTICA Neuronové sítě K dispozici je řada nástrojů, které uživateli pomohou vybrat vhodnou síťovou architekturu. Statistické a grafické nástroje systému zahrnují histogramy, matice a grafy chyb pro celou populaci a pro jednotlivá pozorování, konečná data o správné/nesprávné klasifikaci a všechny důležité statistiky - například vysvětlený podíl rozptylu - se počítají automaticky.

Pro vizualizaci dat v balíčku STATISTICA Neuronové sítě Scatterplots a 3D reakční plochy jsou implementovány, aby pomohly uživateli porozumět „chování“ sítě.
Jakékoli informace získané z uvedených zdrojů můžete samozřejmě použít pro další analýzu jinými prostředky. STATISTIKA, jakož i pro následné zahrnutí do sestav nebo pro přizpůsobení.

STATISTICA Neuronové sítě automaticky si pamatuje nejlepší síťovou možnost z těch, které jste obdrželi při experimentování s úlohou, a můžete se na ni kdykoli odvolat. Užitečnost sítě a její prediktivní schopnost jsou automaticky testovány na speciální testovací sadě pozorování a také pomocí odhadu velikosti sítě, její účinnosti a nákladů na chybnou klasifikaci. Implementováno v STATISTICA Neuronové sítě automatické křížové ověřování a regularizační postupy Wigendovy váhy umožňují rychle zjistit, zda je vaše síť pro daný úkol nedostatečná nebo naopak příliš složitá.

Pro zlepšení výkonu v balíčku STATISTICA Neuronové sítě K dispozici jsou četné možnosti konfigurace sítě. Můžete tedy zadat lineární výstupní síťovou vrstvu v regresních problémech nebo aktivační funkci softmax v problémech pravděpodobnostního odhadu a klasifikace. Pokud mají vaše data mnoho odlehlých hodnot, můžete při trénování sítě nahradit standardní chybovou funkci méně citlivou funkcí "městské bloky". Systém také implementuje chybové funkce křížové entropie založené na modelech teorie informace a řadu speciálních aktivačních funkcí, včetně krokových, pilových a sinusových.


Průvodce řešením (automaticky vyhodnotí problém a vybere několik sítí různých architektur):

  • Součástí balení Neuronová síť STATISTICA s je Průvodce řešením - Inteligentní řešení problémů, která hodnotí mnoho neuronových sítí různých architektur a složitosti a vybírá sítě nejlepší architektury pro danou úlohu.
  • Mistr je schopen budovat sítě pro data s nezávislým pozorováním (standardní regresní sítě, klasifikační sítě nebo smíšené sítě), stejně jako sítě určené k predikci budoucích hodnot určité proměnné na základě existujících hodnot stejné proměnné (čas sériové sítě).
  • Při vytváření neuronové sítě je vynaloženo značné množství času na výběr vhodných proměnných a optimalizaci architektury sítě pomocí heuristického vyhledávání. STATISTICA Neuronové sítě převezme tuto práci a automaticky za vás provede heuristické vyhledávání. Tento postup bere v úvahu vstupní rozměr, typ sítě, rozměry sítě a požadované funkce kódování výstupu.
  • Během vyhledávání můžete nastavit počet odpovědí obdržených během tréninkového procesu. Při nastavení režimu maximálních detailů Průvodce řešením Zobrazí architekturu a úrovně kvality pro každou testovanou síť.
  • Průvodce řešením je extrémně efektivní nástroj pomocí sofistikovaných technik, které vám umožní automaticky najít nejlepší architekturu sítě. Místo toho, abyste trávili mnoho hodin sezením u počítače, nechte systém STATISTICA Neuronové sítě dělat tuto práci za vás.
  • Automatický síťový konstruktor lze také použít během vývoje modelu, kdy modul STATISTICA neuronové sítě, spolu s dalšími moduly základního systému STATISTIKA, slouží k identifikaci nejvýznamnějších proměnných (například nejlepších prediktorů pro jejich následné zahrnutí a testování v jakémkoli modelu Nelineární odhad).


Trénink neuronové sítě:

  • Úspěch vašich vyhledávacích experimentů nejlepší typ a architektura sítě výrazně závisí na kvalitě a rychlosti algoritmů síťového učení. V systému STATISTICA Neuronové sítě Byly implementovány dosud nejlepší tréninkové algoritmy.
  • Trénovat vícevrstvé perceptrony v systému STATISTICA Neuronové sítě Nejprve je implementována metoda zpětného šíření - s časově proměnnou rychlostí učení a koeficientem setrvačnosti, smícháním pozorování před dalším krokem algoritmu a přidáním aditivního šumu pro robustní zobecnění. Navíc v systému STATISTICA Neuronové sítě byly implementovány dva rychlé algoritmy druhého řádu - metody konjugovaných gradientů a Levenberg-Marquard. Posledně jmenovaný je extrémně výkonný moderní nelineární optimalizační algoritmus a odborníci jej velmi doporučují používat. Rozsah použití této metody je zároveň omezen na případy relativně malých sítí s jedním výstupním neuronem a pro obtížnější úlohy v balíčku STATISTICA Neuronové sítě Existuje metoda konjugovaného gradientu. Obvykle oba algoritmy konvergují rychleji než backpropagation a obvykle vytvářejí lepší řešení.
  • Iterativní proces síťového trénování v systému STATISTICA Neuronové sítě je doprovázeno automatickým zobrazením aktuální tréninkové chyby a chyby vypočítané nezávisle na testovací sadě a je zobrazen i graf celkové chyby. Trénink můžete kdykoli přerušit pouhým stisknutím tlačítka. Navíc je možné nastavit podmínky zastavení, za kterých bude trénink přerušen; takovou podmínkou může být např. dosažení určité chybovosti, nebo stabilní nárůst chyby testu po daný počet průchodů – „epoch“ (což značí tzv. přeškolení sítě). Pokud dojde k přemontování, uživateli by to mělo být jedno: STATISTICA Neuronové sítě automaticky si pamatuje instanci nejlepší sítě získanou během tréninkového procesu a tato možnost sítě je vždy přístupná kliknutím na odpovídající tlačítko. Po dokončení síťového školení můžete kvalitu jeho práce zkontrolovat na samostatné testovací sadě.
  • V balení STATISTICA Neuronové sítě také implementován celá řada učící algoritmy pro jiné sítě jiných architektur. Parametry radiálních splajnů a vyhlazovacích koeficientů pro sítě založené na radiální základní funkci a zobecněné regresní sítě lze vybrat pomocí algoritmů, jako jsou: Kohonen trénink, dílčí vzorek, Metoda K-means, izotropie a metody nejbližšího souseda. Neurony lineární výstupní vrstvy sítí založené na funkci radiální báze, jako jsou neurony lineárních sítí, jsou plně optimalizovány. metoda dekompozice singulární hodnoty (SVD)..
  • Tvorba hybridních síťových struktur. V systému STATISTICA Neuronové sítě Je možné vytvářet sítě smíšené struktury. Například v upravené síti založené na funkci radiální báze lze trénovat první vrstvu neuronů Kohonenův algoritmus aha, a ten druhý - nelineární vrstva - Levenberg-Marquardova metoda.


Testování neuronové sítě:

  • Poté, co je síť vyškolena, musíte zkontrolovat kvalitu její práce a určit její vlastnosti. Pro tento účel v balení STATISTICA Neuronové sítě K dispozici je sada statistik na obrazovce a grafických nástrojů.
  • V případě, že je specifikováno několik modelů (sítí a souborů), pak (pokud je to možné) Neuronová síť STATISTICA s zobrazí srovnávací výsledky (například vynesení křivek odezvy několika modelů do jednoho grafu nebo zobrazení prediktorů několika modelů v jedné tabulce). Tato vlastnost je velmi užitečná pro srovnání různé modely, trénovaný na stejném souboru dat.
  • Všechny statistiky se počítají samostatně pro tréninkové, validační a testovací sady. Všechny váhy a aktivační parametry jsou dostupné jako pohodlný textový soubor, který lze jedním kliknutím převést na tabulku výsledků systému STATISTIKA. Experimentální výsledky pro jednotlivá pozorování nebo pro celý soubor dat lze také zobrazit v tabulkové formě STATISTIKA a použít v dalších analýzách nebo grafech.
  • Automaticky se vypočítávají následující souhrnné statistiky: střední kvadratická chyba sítě, tzv. matice diskrepance (záměna matice) u klasifikačních problémů (kde se sečtou všechny případy správné a nesprávné klasifikace) a podíl vysvětlené regrese u regresních problémů. Síť Kohonen má okno Topologická mapa, ve kterém můžete vizuálně pozorovat aktivaci síťových prvků a také měnit označení pozorování a uzlů v procesu analýzy dat. K dispozici je také okno Win Frequency, které umožňuje okamžitě lokalizovat clustery v topologické mapě. Shluková analýza lze provést pomocí kombinace sítě standardní architektury se speciálním schématem systémového clusteru STATISTICA Neuronové sítě. Můžete například trénovat síť pro analýzu hlavních komponent a vykreslit grafy dat promítnutých do prvních dvou komponent.

Úpravy, úpravy a sériové spojování neuronových sítí

V systému STATISTICA Neuronové sítě Existují inteligentní nástroje, které vám umožní odříznout kusy ze stávajících sítí a propojit více sítí dohromady. Můžete tedy odebrat nebo přidat jednotlivé neurony, odstranit celou vrstvu ze sítě a sítě, které jsou konzistentní v počtu vstupů/výstupů, mohou být postupně vzájemně propojeny. Díky těmto vlastnostem se paket STATISTICA Neuronové sítě umožňuje používat nástroje, jako je redukce rozměrů (během předběžného zpracování) pomocí asociativních sítí a matice ztrát (pro rozhodování s nejmenšími ztrátami). Matice ztrát se automaticky používá při práci s pravděpodobnostními neuronovými sítěmi.

Hotová řešení (zakázkové aplikace využívající STATISTICA Neural Networks):

  • Jednoduché a pohodlné systémové rozhraní STATISTICA Neuronové sítě umožňuje rychle vytvářet aplikace neuronové sítě pro řešení vašich problémů.
  • Může nastat situace, kdy je nutné tato řešení integrovat do stávajícího systému, např. učinit z nich součást širšího výpočetního prostředí (může se jednat o postupy vyvinuté samostatně a zabudované do podnikového výpočetního systému).
  • Trénované neuronové sítě lze aplikovat na nové datové sady (pro predikci) několika způsoby: Můžete uložit natrénovanou síť nebo soubor sítí (například pro výpočet průměrné predikce na základě více architektur) a poté ji aplikovat na novou datovou sadu ( pro predikci, predikovanou klasifikaci nebo prognózování); K automatickému generování programového kódu v jazyce můžete použít generátor kódu C (C++, C#) nebo Visual Basic a dále je používat k predikci nových dat v jakémkoli softwarovém prostředí Visual Basic nebo C++ (C#), tj. implementujte plně vyškolenou neuronovou síť do vaší aplikace. Na závěr veškerá funkčnost systému STATISTIKA, počítaje v to STATISTICA Neuronové sítě lze použít jako Objekty COM (Component Object Model) v jiných aplikacích (např. Java, MS Excel atd.). Můžete například implementovat automatizované analýzy vytvořené v STATISTICA Neuronové sítě ke stolům MS Excel.


Seznam výukových algoritmů:

  • Backpropagation;
  • Levenberg-Marquard;
  • Konjugované gradienty;
  • kvazi-newtonský;
  • Rychlé šíření;
  • Delta-delta-s-bar;
  • Pseudoinverzní;
  • Kohonen školení;
  • Označení blízkých tříd;
  • Tréninkový vektorový kvantizér;
  • Radiální (pod)vzorkování;
  • metoda K-means;
  • metoda K-Nearest Neighbors (KNN);
  • Nastavení izotropních odchylek;
  • Nastavení zjevných odchylek;
  • Pravděpodobnostní neuronová síť;
  • Generalizovaná regresní neuronová síť;
  • Genetický algoritmus pro výběr vstupních dat;
  • Přímý nebo zpětný výběr vstupních dat krok za krokem.

Požadavky na systém

Systém STATISTICA Neuronové sítě může fungovat i na relativně slabých nebo starých počítačích. Protože je však mnoho procedur balíku výpočetně náročných, důrazně se doporučuje používat Procesor Pentium s 32 MB paměti RAM.


Omezení velikosti sítě:

  • Neuronová síť může mít téměř jakoukoli velikost (to znamená, že její rozměry mohou být mnohonásobně větší, než je skutečně nutné a rozumné); Je povoleno až 128 vrstev bez omezení počtu neuronů. Ve skutečnosti je pro jakékoli praktické úkoly program omezen pouze hardwarovými možnostmi počítače.


Elektronická příručka:

  • Jako součást systému STATISTICA Neuronové sítě existuje dobře ilustrovaná učebnice, která poskytuje úplný a jasný úvod do neuronových sítí a také příklady. V každém dialogovém okně je k dispozici systém podrobné, kontextové nápovědy.


Generátor zdrojového kódu:

  • Generátor zdrojový kód je doplňkový produkt, který uživatelům umožňuje snadno vytvářet vlastní aplikace založené na systému STATISTICA Neuronové sítě. Tento doplňkový produkt vytváří zdrojový systémový kód pro model neuronové sítě (jako soubor v C, C++, C#), který lze samostatně zkompilovat a integrovat do vašeho programu pro bezplatné šíření. Tento produkt je navržen speciálně pro vývojáře podnikových systémů a také pro uživatele, kteří potřebují transformovat vysoce optimalizované postupy vytvořené v STATISTICA Neuronové sítě do externích aplikací pro řešení složitých analytických problémů.

Metody neuronových sítí jsou stále více rozšířené v různých oblastech.

Průmysl:

  • Procesní řízení (zejména sledování výrobních procesů s plynulou regulací kontrolních parametrů).
  • Klasifikace vzorků paliv (segmentace druhů paliv na základě analýzy jejich spekter).
  • Technická diagnostika (použití vibrací a hluku k včasné identifikaci závad v mechanismu a provádění preventivních oprav).
  • Řídicí systémy motoru (vyhodnocování a řízení spotřeby paliva pomocí dat snímačů).
  • Spínací detektorové systémy v reálném čase ve fyzice. Neuronové sítě jsou odolné proti šumu a umožňují použití robustních vzorů ve fyzických datech s velkým statistickým šumem.


Marketing:

  • Předpovídání cen zlata;
  • Prognózy cen surovin;
  • Obchodujte přímou poštou.


Finance:

  • Posouzení bonity (klasickým úkolem je zjistit z osobních údajů, zda je daný dlužník spolehlivý).
  • Prognóza finančních časových řad.


Geologický průzkum:

  • Zvyšování efektivity těžebního procesu (zvýraznění významných faktorů ovlivňujících ukazatele efektivity těžby).


Další průmyslová odvětví:

  • Optické rozpoznávání znaků, včetně rozpoznávání podpisů;
  • Zpracování obrazu;
  • Předpovědi chaotické časové řady;
  • Lékařská diagnostika;
  • Syntéza řeči;
  • Lingvistická analýza.

a ukázat, jak je organizován dialog s uživatelem systému.

Dbejte na uživatelsky přívětivé rozhraní a dostupnost nástrojů , A Metoda vícenásobného podvzorkování, což uživatelům umožňuje navrhovat vlastní sítě a vybrat si ty nejlepší.

Nejprve tedy spustíme neuronové sítě.

Krok 1. Začnete s odpalovací rampou (viz obrázek 1).

V tomto panelu můžete vybrat různé typy analýz, které potřebujete provést: regresi, klasifikaci, prognózu časových řad (se spojitou a kategoricky závislou proměnnou), shlukovou analýzu.

Rýže. 1. Launchpad STATISTICA automatizované neuronové sítě (SANN)

Vyberte například Časová řada (regrese), pokud chcete udělat předpověď, popř Klasifikace, pokud se řeší klasifikační problém.

Stisknutím tlačítka OK, přejdeme do dialogového okna pro výběr dat.

Rýže. 2. Dialog Neuronové sítě - Výběr dat - Rychlá záložka

Krok 2. Na kartě Rychle měli byste vybrat potřebné proměnné pro analýzu. Proměnné mohou být spojité nebo kategorické, závislé nebo nezávislé; kromě toho mohou pozorování patřit k různým vzorkům.


Rýže. 3. Okno pro výběr proměnných

Pro začínající uživatele se doporučuje zvolit strategii Zkušený uživatel může snadno použít jakoukoli dostupnou strategii: automatizovaná neuronová síť (ANN), Vlastní neuronová síť (CNN) A Vybereme Automatizovaná neuronová síť (ANN).

Rýže. 4. Dialogové okno Neuronové sítě - Výběr dat - Rychlá záložka

Na kartě Dílčí vzorky (PNS a ANS) měli byste nastavit požadované rozdělení dat do dílčích vzorků: trénink, kontrola a test. Oddíl lze nastavit náhodně nebo jej lze opravit pomocí dodatečné proměnné kódu.

V tomto případě použijeme náhodné rozdělení.

Rýže. 5. Dialogové okno Neuronové sítě - Výběr dat - karta Dílčí vzorky (ANS a PNS)

Tab Dílčí vzorky (PNS a ANS) určeno pro první dvě strategie: Automatizovaná neuronová síť (ANN) A Vlastní neuronová síť (CNN); v záložce Vytváření dílčích vzorků používá se pro druhou strategii: Metoda vícenásobného podvzorkování.

Klikněte OK a přejděte ke kroku specifikování parametrů architektury.

Krok 3 Na kartě Rychle dialogové okno Automatizované neuronové sítě musíte zadat typ sítě, počet skrytých neuronů, počet trénovaných a uložených sítí a typ použitých chybových funkcí.

Program nabízí následující typy sítí: vícevrstvé perceptrony a sítě s radiální bází.

Rýže. 6. Dialogové okno Automatizované neuronové sítě – záložka Rychlá

Rýže. 7. Dialog Automatizované neuronové sítě - záložka Aktivační funkce pro MKP

Na kartě Útlum Můžete povolit možnost regularizace hmotnosti, která upraví složitost trénovaných sítí. To je užitečné, když má problém velký počet vstupních proměnných a je specifikováno velké množství neuronů ve skryté vrstvě.

To ale v našem případě nevyužijeme.

Rýže. 8. Dialog Automatizované neuronové sítě - záložka Útlum

Nyní můžeme přejít ke kroku trénování neuronové sítě.

Krok 4. Kliknutím na tlačítko spusťte proceduru trénování neuronové sítě OK.

V dialogovém okně zobrazeném na Obr. 9 jsou zobrazeny některé informace o aktuálně trénované neuronové síti. Můžeme analyzovat architekturu sítě, sledovat průběh iterací algoritmu a zaznamenávat chyby modelu. Pro regresi se používá střední kvadratická chyba, pro klasifikaci procento správně klasifikovaných pozorování (jako v našem případě).

Rýže. 9. Dialogové okno Trénink neuronové sítě

Program automaticky přejde na další krok.

Krok 5. Analýza výsledků. V okně výsledků můžete analyzovat získaná řešení. Program vybere nejlepší sítě a ukáže kvalitu řešení.

Rýže. 10. Dialogové okno Neuronové sítě - Výsledky - záložka Predikce

Konkrétní síť, podle našeho názoru nejlepší, vyberete pomocí tlačítka Vyberte/zrušte zaškrtnutí sítí.

Rýže. 11. Dialogové okno Aktivace modelu

Jedním ze způsobů testování je například porovnání pozorovaných hodnot a předpokládaných výsledků. Porovnání pozorovaných a predikovaných hodnot pro vybranou síť, například tréninkové a testovací sady.

Rýže. 12. Tabulka pozorovaných a predikovaných hodnot

Nebo se podívejte na matici chyb klasifikace na zkušebním vzorku:

Rýže. 13. Klasifikační matice

Krok 6. Uložte si nejlepší sítě pro budoucí použití, například pro automatické předpovídání.

Pro další spuštění jsou sítě uloženy ve formátu PMML.

Rýže. 14. Dialogové okno Neuronové sítě - Výsledky - Ukládání sítí

Rýže. 15. Standardní okno pro ukládání síťového souboru

Krok 7 Spusťte uložené modely na nových datech. Načteme tedy nová data, ale tak, aby proměnné odpovídaly proměnným v modelech.

Chcete-li spustit model na nových datech, můžete vybrat možnost na spouštěcím panelu (obr. 1) Načíst modely z předchozích analýz a stiskněte tlačítko Načíst sítě.

Rýže. 16. Standardní okno pro výběr síťového souboru

Dostaneme:

Rýže. 17. Panel STATISTICA automatizované neuronové sítě (SANN)

Po výběru požadovaného souboru se automaticky určí všechna nastavení, takže můžete okamžitě přejít do okna výsledků (dvojitým kliknutím na tlačítko OK) a analyzovat získané výsledky.

To je přesně typický scénář výzkumu v balíčku

Balíček Statistica Neural Networks (SNN).

  1. Otevřete datový soubor Series_g z údajů dostupných v balíčku. Soubor obsahuje jednu proměnnou, která určuje objem provozu za několik let s měsíčním záznamem dat. (Když otevřete tento soubor, objeví se řada tabulek souvisejících s volbou inteligentního řešitele, kterou je v této fázi nutné zavřít a ponechat pouze zdrojovou datovou tabulku).
  2. Typ proměnné „vstup – výstup“ nastavte následovně: vyberte proměnnou kliknutím na záhlaví tabulky, klikněte pravým tlačítkem a vyberte možnost z nabídky Vstup výstup. Název proměnné bude zvýrazněn zeleně.
  3. Vytvořit nová síť pomocí dialogového okna Vytvořit síť. Chcete-li to provést, stiskněte postupně: Soubor – Nový – Síť. Na obrazovce monitoru je dialogové okno (obr. 1).

Rýže. 1. Dialogové okno vytvoření sítě

V problému predikce časových řad musí síť vědět, kolik kopií jedné proměnné má vzít a jak daleko dopředu by měla předpovědět hodnotu proměnné. V této úloze přijměte parametr Kroky (časové okno) rovno 12, protože data jsou měsíční pozorování a parametr Dívat se dopředu- rovná se 1.

  1. Jako typ sítě vyberte Multilayer Perceptron a nastavte počet vrstev sítě na 3. Poté klikněte na tlačítko Poradit, v důsledku čehož program automaticky nastaví počet neuronů ve všech třech vrstvách sítě: 12 – 6 – 1 (obr. 2).

Rýže. 2. Dialogové okno po nastavení parametrů sítě

Poté stiskněte tlačítko Vytvořit.

  1. Při vytváření sítě SNN automaticky přiřadí prvních 12 pozorování z datového souboru typu Ignorovat. Při dalším tréninku a provozu sítě v úloze analýzy časových řad obsahuje každý datový blok přivedený na jeho vstup data týkající se několika pozorování. Celý blok je přiřazen k pozorování, které obsahuje hodnotu výstupní proměnné. V důsledku toho není prvních 12 pozorování ve skutečnosti ignorováno, ale jsou vstupy do prvního bloku dat časové řady, který odpovídá pozorování č. 13. Ve skutečnosti program sestaví transformovanou datovou sadu, ve které je počet pozorování o 12 méně, ale data v každém pozorování jsou převzata ze 13 po sobě jdoucích řádků zdrojového souboru.

Vytvořená síť je znázorněna na Obr. 3.

Rýže. 3. Třívrstvý perceptron

  1. V okně zdrojových dat "Editor datové sady" sada 66 školení (Výcvik) a 66 ovládacích prvků (Ověření) pozorování (obr. 4), poté stiskněte tlačítko pro promíchání řádků následovně: přes menu Upravit – PřípadyZamíchat – Vše (Editace – Případy – Zamíchat – Vše).
  2. Trénujte síť pomocí metody Levenberg-Marquard kliknutím: VlakVícevrstvý Perceptron – Levenberg-Marquardt (Vlak – Vícevrstvý Perceptron – Levenberg-Marquardt). Proces učení trvá několik sekund (v závislosti na typu procesoru). Levenberg-Marquardova metoda je jedním ze spolehlivých a rychle se učících algoritmů, ale její použití je spojeno s určitými omezeními:

Rýže. 4. Okno zdrojových dat s oddělenými pozorováními

  • tuto metodu lze použít pouze pro sítě s jedním výstupním prvkem.
  • Levenberg-Marquardova metoda vyžaduje paměť úměrnou druhé mocnině počtu vah v síti, takže metoda není vhodná pro velké sítě (řádově 1000 vah).
  • Metoda je použitelná pouze pro funkci střední kvadratické chyby.

Algoritmus Levenberg-Marquard je navržen tak, aby minimalizoval funkci střední kvadratické chyby. V blízkosti minimálního bodu tento předpoklad platí s velkou přesností, takže algoritmus se pohybuje velmi rychle. Tento předpoklad nemusí být ani zdaleka minimální, takže metoda nachází kompromis mezi lineárním modelem a gradientním klesáním. Krok se provede pouze v případě, že sníží chybu, a tam, kde je to nutné, se k zajištění postupu použije gradientní klesání s dostatečně malým krokem.

Dialogové okno metody Levenberg-Marquard je znázorněno na Obr. 5.

Rýže. 5. Dialogové okno metody Levenberg-Marquard

Hlavní prvky okna:

  • Epochs (počet epoch)– nastavuje počet epoch, během kterých poběží algoritmus. V každé epoše prochází sítí celý tréninkový set a následně se upravují váhy.
  • Křížové ověření– když je pozice označena, je kvalita výsledku vytvořeného sítí v každé epoše kontrolována oproti kontrolní sadě (pokud je specifikována). Po vypnutí jsou kontrolní pozorování ignorována, i když jsou v datovém souboru přítomna.
  • Vlak– Při každém stisku tlačítka algoritmus projde zadaným počtem epoch.
  • Znovu inicializovat– před opětovným zahájením tréninku byste měli stisknout tlačítko reset, protože v tomto případě jsou váhy sítě opět náhodně nastaveny.
  • Běžecké závaží – Když se algoritmus může zaseknout na místním minimu, tato možnost přidá ke každé váze malou částku.
  1. Sestrojte projekci časové řady pomocí Run – Times Series Projection otevřete příslušné okno (obr. 6).

Rýže. 6. Okno projekce časové řady

Popis dialogového okna

  • Start– určuje, zda má projekce časové řady začínat na nějakém čísle pozorování (číslo případu) v datovém souboru nebo z individuálního pozorování.
  • případ č. – Při promítání časové řady z datového souboru je uvedeno číslo pozorování s výstupní hodnotou, od které se má začít.
  • Délka– počet kroků, pro které bude prognóza promítnuta.
  • Variabilní– označuje proměnnou, která bude navržena.
  1. Pomocí trénované sítě můžete provést projekci časové řady. Zpočátku bude síť pracovat na prvních 12 vstupních hodnotách, což povede k predikci další hodnoty. Potom je předpovězená hodnota spolu s předchozími 11 vstupními hodnotami opět přivedena na vstup sítě a ten vytvoří předpověď další hodnoty.

Jediným ovládacím parametrem, který je třeba zvolit, je délka projekce. V tomto příkladu je celkem 144 pozorování, z nichž 12 bude odstraněno předúprava, takže výsledky lze porovnávat maximálně ve 132 krocích. Je však možné promítnout řadu za hranice dostupných dat, ale výsledek nebude s čím porovnávat.

Zobrazte chování predikovaných hodnot v různých délkách pomocí tlačítka Běh můžete pozorovat změny v cílových a výstupních hodnotách série.

Na uvedeném Obr. Obrázek 6 ukazuje, že předpokládaná křivka (modrá na obrazovce monitoru) nebyla natrénována příliš dobře, protože mezi původní a předpovězenou sérií existují významné odchylky, počínaje přibližně 70 pozorováními.

  1. Provádějte prognózování sérií pomocí inteligentního řešitele (třetí tlačítko zleva v horním řádku). V tomto případě je nutné v dialogovém režimu odpovědět na řadu otázek:
  • Vyberte hlavní verzi (obr. 7) a klikněte Další.

Rýže. 7. Výběr hlavní verze

  • Určete typ úlohy (standardní nebo časová řada). Zde je nutné si povšimnout časové řady (obr. 8).

Rýže. 8. Výběr typu úlohy

  • Dobu pozorování nastavte na 12 měsíců (obr. 9).

Rýže. 9. Nastavení doby pozorování

  • Vyberte závislé a nezávislé proměnné, které jsou stejnou proměnnou Série.
  • Určete dobu postupu výpočtu rovnající se 2 minutám (obr. 10).

Rýže. 10. Nastavení doby vypořádání

  • Uveďte počet sítí, které mají být uloženy, a akce, které je třeba provést při jejich ukládání (obr. 11).

Rýže. 11. Akce pro výběr sítí

  • Vyberte formuláře pro prezentaci výsledků (obr. 12) a klikněte Dokončit.

Rýže. 12. Výběr formuláře pro prezentaci výsledků

Díky použití inteligentního řešitele je předpověď mnohem přesnější, protože natrénovaná síť je mnohem blíže původní řadě (obr. 13).

Rýže. 13. Prognóza pomocí inteligentního řešitele

Cvičení

Vytvořte simulovanou časovou řadu z balíčku Statistica následovně:

  • Vytvořte nový soubor skládající se z 20 řádků a 2 sloupců.
  • Prostřednictvím nabídky Data – proměnné specifikace do okna vzorce zadejte výraz =vnormal(rnd(1);1;3).
  • Simulujte 20 hodnot náhodné normálně rozdělené proměnné s matematickým očekáváním rovným 1 a směrodatnou odchylkou rovnou 3. Těchto 20 hodnot definuje proměnnou Var 1. Převeďte je na celočíselný datový typ a nastavte jej do proměnné okno popisu jako Typ význam Celé číslo.
  • Přejděte na proměnnou Var 2 následovně: první hodnota Var 2 je rovna první hodnotě proměnné Var 1; druhá hodnota Var 2 se rovná součtu prvních dvou hodnot proměnné Var 1; třetí hodnota proměnné Var 2 se rovná součtu prvních tří hodnot proměnné Var 1 atd.
  • Zkopírujte proměnnou Var 2 a přejděte do balíčku SNN a umístěte zkopírovaná data do nově vytvořeného souboru.
  • Proveďte prognózu výsledné řady pomocí neuronové sítě.

tištěná verze

Jsou nastíněny metody neuronové sítě pro analýzu dat, založené na použití balíku Statistica Neural Networks (vyrábí StatSoft), plně přizpůsobeného pro ruského uživatele. Jsou uvedeny základy teorie neuronových sítí; Velká pozornost je věnována řešení praktických problémů, metodologie a technologie provádění výzkumu pomocí balíku Statistica Neural Networks - výkonného nástroje pro analýzu a prognózování dat, který má široké uplatnění v obchodu, průmyslu, managementu a financích - je komplexně přezkoumána. Kniha obsahuje mnoho příkladů analýzy dat, praktická doporučení pro analýzu, prognózování, klasifikaci, rozpoznávání vzorů, řízení výrobních procesů pomocí neuronových sítí Pro široké spektrum čtenářů zabývajících se výzkumem v bankovnictví, průmyslu, ekonomice, obchodu, geologickém průzkumu, management, doprava a další oblasti. ObsahPředmluva k druhému vydáníÚvod. Pozvání do neuronových sítíKapitola 1. ZÁKLADNÍ KONCEPCE ANALÝZY DATKapitola 2. ÚVOD DO TEORIE PRAVDĚPODOBNOSTIKapitola 3. ÚVOD DO TEORIE NEUROVÝCH SÍTÍKapitola 4. VŠEOBECNÝ PŘEHLED NEUROVÝCH SÍTÍSPralelů a postprocesorových sítí z perprocessinguBaultlayers ceptronRadiální základní funkce Pravděpodobnostní neuronová síť Generalized regresní neuronová síťLineární síťSíť Kohonen Klasifikační problémyRegresní problémyPrognóza časových řadVýběr proměnných a redukce rozměrůKapitola 5. PRVNÍ KROKY VE STATISTICE NEURÁLNÍ SÍTĚ.ZačínámeVytváření datové sadyVytvoření nové sítěVytvoření datové sady a sítěTrénink sítěProvozování neuronové sítěCAPChap6FARTHAB NETWORKSCklasický příklad: Fisher's IrisesTrénink s křížovou validací Podmínky zastavení Řešení regresních problémů Funkce radiální báze Lineární modely Kohonenovy sítě Pravděpodobnostní a zobecněné regresní sítě Konstruktor sítě Genetický algoritmus pro výběr vstupních dat Časová řada Kapitola 7. PRAKTICKÉ TIPY PRO ŘEŠENÍ PROBLÉMŮ s daty Isolation Prezentace prezentace. Redukce dimenzionality Výběr architektury sítě Vlastní architektury sítě Časové řady Kapitola 8. PŘÍKLADY APLIKACE (PŘÍPADOVÉ STUDIE )Příklad 1. Snížení dimenzionality v geologickém výzkumu Příklad 2 Rozpoznávání vzorů Příklad 3. Nelineární klasifikace dvourozměrných souborů Příklad 4. Segmentace různých paliv vzorky podle laboratorního výzkumu Příklad 5. Sestavení modelu behaviorálního bodováníPříklad 6. Přiblížení funkcíPříklad 7. Prognóza prodeje ropyPříklad 8. Sledování a předpovídání teplotních podmínek v instalaciPříklad 9. Určení spolehlivosti digitálního podpisuKapitola 9. STRUČNÝ PŘÍRUČKA Datová síť Školicí sítěDalší typy sítíPráce se sítí STATISTTERPředávání výsledků do systému 10. KLASICKÉ METODY, ALTERNATIVNÍ K NEURÁLNÍ SÍTIKlasická diskriminační analýza ve STATISTICA Klasifikace Logitová regrese Faktorová analýza ve STATISTICE Kapitola 11. DATOVÁ MINACE VE STATISTICE Příloha 1. Generátor kódu Příloha 2. Integrace STATISTICA s ERP systémy Reference Předmět