Zašto je potreban, taj XML? Zašto nam je potreban XML? Zašto nam je potreban novi označni jezik?

Zašto je potreban ovaj XML?

[U u posljednje vrijeme, u vezi s pojavom ovih stranica, najčešći
Ispostavilo se da je pitanje za mene bilo: "Recite mi, zašto je uopće potreban, XML?
Zar nam HTML nije dovoljan? "Nemajući puno vremena (ili pameti;) za pripremu vlastitih publikacija, a također duboko poštujući klasike, radije sam brzo preveo izvrstan članak naslovljene teme
- možda je ovo prva epizoda serije "u pomoć"]

Jon Bosak, Tim Bray
XML i Web druge generacije
iz Scientific Americana, svibanj 1999

Dajte ljudima nekoliko savjeta, a oni će sami shvatiti ostalo. Gledajući stranicu, gdje su veći blokovi teksta podijeljeni na manje, svatko brzo shvati da je to početak članka. Gledajući popis namirnica, brzo možete pogoditi da se radi o “uputama” za posjet trgovini. Kada vidite stupce brojeva, shvatit ćete da se radi o bankovnom računu.

Upravo u tu svrhu - kako bi informacije bile samoopisive - izumljen je novi jezik za označavanje dokumenata - Extensible Markup Language (XML). Ove lako izrečene promjene (“samoopisani” dokument, promjena pravila komunikacije s računalima) nose golem potencijal - uloga Interneta od medija za dostavu informacija počinje se širiti i na druge vrste ljudskih aktivnosti. Doista, od odobrenja W3C-a 1998., XML specifikacija je brzo šumski požar počeo prodirati posvuda - u industriju i znanost, u proizvodnju robe i medicine.

Entuzijasti su se nadali da će XML omogućiti rješavanje brojnih problema globalni problemi Web. Ovi problemi su poznati: prvo, Internet, superbrza mreža, često se ponaša gore od kornjače; i drugo, iako su gotovo sve informacije dostupne na Internetu, tamo je često izluđujuće teško pronaći nešto potrebno.

Oba ova problema uzrokovana su uglavnom prirodom glavnog jezika weba - HTML-a. Iako je uspjeh HTML-a u usporedbi s drugim jezicima ikada predloženim elektroničke publikacije Očito je da je HTML previše rijedak: on u osnovi samo govori pregledniku kako postaviti tekst, slike i gumbe na stranicu. HTML se fokusira na prezentaciju informacija i stoga ga je prilično lako naučiti, ali ima svoju cijenu.

To se odražava u složenosti razvoja web stranica, osim ako te stranice nisu zamišljene kao faks strojevi, koji šalju stranice svakome tko zatraži. Više od polovice ljudi i tvrtki diljem svijeta preferiralo bi web stranice koje mogu primati narudžbe od korisnika, slati dijagnoze bolesti, pa čak i izvoditi delikatne instrumentalne operacije u tvorničkim podovima i znanstvenim laboratorijima. HTML se _NIKAD_ nije suočio s takvim zadacima.

Na primjer, čak i ako vaš liječnik može "izvući" testove iz vaše medicinske kartice u svoj preglednik, malo je vjerojatno da će ih moći poslati putem mreže drugom stručnjaku kako bi primljeni odgovor umetnuo natrag u svoj baza podataka. Njegovo računalo ne zna što bi s informacijama koje su mu jasne kao

pčela pčela

ili pčela pčela.
Legendarni Kernighan jednom je primijetio da je cijeli trik WYSIWYG principa (što vidim to i dobijem) u tome da kada ne vidite ništa, obično uspijete dobiti točno isti iznos.

Te riječi iznad koje su zatvorene u uglastim zagradama nazivaju se oznakama. U HTML-u nema oznake za raščlanjivanje, a otuda i njegov drugi nedostatak: nefleksibilnost. Dodavanje nove oznake jeziku takva je birokratska birokratija, toliko duga da se nitko neće time zamarati. Ali bilo bi lijepo da svaki program ima svoje oznake, a ne samo ovaj u primjeru s doktorom.

To uvelike objašnjava trenutni spori tempo stvaranja online trgovina, kataloga za naručivanje poštom i drugih interaktivnih stranica. Ako promijenite broj jedinica narudžbe i način dostave, i vidite pregršt brojeva promijenjenih u polju "iznos", ipak ćete morati zatražiti od udaljenog (već preopterećenog) poslužitelja da vam pošalje kompletnu novogeneriranu stranicu s grafika i sve ostalo. Dok će vaše moćno računalo ležati jer je upravo naučilo nešto poput

I , ali ne i cijene s mogućnošću dostave.

Ovome dodajte lošu kvalitetu mogućnosti pretraživanja weba. Budući da ne postoji način za posebno označavanje informacija o cijeni, apsolutno je nemoguće pretraživati ​​web stranice na temelju "cijene".


Nešto staro, nešto novo

U principu, rješenje je jednostavno: oznake moraju označavati o kakvoj se informaciji radi, a ne kako bi trebala izgledati. Na primjer, označite komponente narudžbe za košulju s oznakama "cijena, veličina, količina, boja" umjesto "podebljano, odlomak, redak, stupac", kao što je predloženo u HTML-u. Tada je programu lakše identificirati dokument kao narudžbu i obaviti ostatak posla: prikazati ovu narudžbu u ovom ili onom obliku, staviti je kroz računovodstveni sustav ili osigurati da nova košulja bude isporučena na vaš kućni prag. sljedeći dan.

Mi, radna skupina W3C je još 1996. godine počeo razvijati takav projekt. Ideja je bila jaka, iako ne posve originalna. Generacijama su urednici i tiskari obilježavali rukom pisane tekstove oznakama slovoslagača. Takav se “označni jezik” samostalno razvijao do 1986. godine, kada je kao rezultat desetogodišnjeg rada Međunarodna organizacija za standardizaciju (ISO) uvela sustav za stvaranje novih označnih jezika.

Nazvan SGML (Standard Generalized Markup Language), ovaj jezik za opis jezika - metajezik - dokazao je svoju korisnost u mnogim velikim izdavačkim sustavima. Čak je i HTML dobio svoju definiciju kroz SGML. Jedina poteškoća sa SGML-om bila je ta što je bio svejed - bilo je tu mnogo pametnih stvari za minimiziranje pritisaka tipki, budući da se u to vrijeme svaki bajt brojao. Zbog toga današnji internetski preglednici ne rade dobro s njim.

Stvaranjem XML-a, naša radna grupa skinula je SGML ljuske i predložila visoko ciljani i probavljivi metajezik. XML baza je skup pravila prema kojima svatko može kreirati vlastiti označni jezik.


<имя пациента>Ova su pravila odabrana tako da se jedan mali program (također naziva parser ili analizator sintakse) može nositi s prepoznavanjem bilo kojeg novog jezika. Pogledajmo ponovno primjer liječnika koji želi prenijeti pretrage na specijaliste. Kad bi medicinski stručnjaci konstruirali vlastiti označni jezik od XML-a za kodiranje liječničkih bilješki (niz skupina radilo je na problemu dugo vremena), tada bi poruka liječnika njegovom kolegi mogla sadržavati nešto poput
<аллергия на лекарство>bla bla

bla bla bla

U ovoj postavci više nije teško napisati program za proizvoljno računalo tako da ono može prepoznati te standardizirane medicinske zapise i moći unijeti ove doslovno vitalne informacije u svoju bazu podataka.

Baš kao što je HTML osmišljen da svakome omogući čitanje internetskih dokumenata, XML nam daje esperanto koji svatko može čitati i pisati, unatoč gomili nekompatibilnih platformi. Da, čak i sa stajališta obične osobe, XML ima više semantičkog opterećenja (za razliku od drugih formata podataka), jer u njemu nema ničega što bi izgledalo kao nečitljiv tekst.

Pravilo ugniježđivanja automatski nameće jednostavnost bilo kojeg XML dokumenta, stvarajući strukturu poznatu u računalnoj znanosti kao stablo. Slično obiteljskom stablu, svaki grafički ili tekstualni element dokumenta je otac, sin ili brat (roditelj, dijete, brat ili sestra) nekog drugog elementa, a taj je odnos uvijek jedinstven. Naravno, stabla ne opisuju cjelokupnu raznolikost struktura podataka, ali pokrivaju većinu tipičnih slučajeva korištenja računala. Osim toga, stabla su izuzetno prikladna za programere. Nema problema u pisanju malog dijela koda za promjenu redoslijeda transakcija ili prikaz potpuno razumljivog računa kada je račun predstavljen kao stablo.

Drugi izvor univerzalne snage XML-a je njegovo oslanjanje na novi standard Unicode, sustav kodiranja koji omogućuje miješanje teksta na svim glavnim svjetskim jezicima. Naprotiv, u HTML-u, kao iu većini programa za obradu teksta, dokument u pravilu može biti samo na jednom određenom jeziku, bez obzira na kojem - engleskom, japanskom ili arapskom.
A ako program ne poznaje kodiranje određenog jezika, možete zaboraviti na dokument (u HTML-u). Može biti i gore: na primjer, zbog nekonzistentnosti kodiranja, programi napisani u Tajvanu često ne mogu čitati tekstove namijenjene kontinentalnoj Kini. U slučaju XML-a, ako program zna kako ispravno raditi s njim, može se nositi s bilo kojom kombinacijom kodiranja.


Dakle, XML ne samo da omogućuje razmjenu podataka između različitih računalnih platformi, već također omogućuje prevladavanje nacionalnih i kulturnih barijera.

Kraj svjetskog čekanja

Za ilustraciju, zamislite da pomoću internetske putničke agencije pronađete let iz Londona za New York 4. srpnja. Najvjerojatnije ćete vidjeti popis nekoliko puta duži nego što može stati na ekran. Taj se popis može skratiti postavljanjem preciznijih parametara kao što su vrijeme polaska, cijena ili avioprijevoznik, no u tom slučaju jednostavno “učitate” server turističke agencije svojim zahtjevom i morate čekati odgovor. Međutim, ako vam je ovaj dugačak popis letova dostavljen u XML-u, ured bi ga mogao popratiti malim Java appletom, uz pomoć kojeg možete odmah i jednostavno razvrstati i filtrirati nepotrebne, bez pribjegavanja ikakvoj interakciji s poslužiteljem.

Pomnožite to s milijunima web korisnika i ukupni učinak je impresivan.

Što je više mrežnih informacija označeno XML oznakama specifičnim za industriju, lakše ćete pronaći ono što tražite. Danas će vas internetska potraga za “posao za burzovnog mešetara” zatrpati lavinom oglasa, no za posao će ih vjerojatno biti malo – većina posla krije se na besplatnim oglasnim pločama novinskih stranica koje pretražuju roboti ne volim raditi s.

A sada Newspaper Association of America stvara vlastiti jezik za označavanje oglasa u XML-u, koji obećava da će proces pretraživanja učiniti mnogo učinkovitijim.

Naravno, informacije se mogu dobiti i bez traženja. Naposljetku, Web je hipertekst - milijarde stranica prožetih hipervezama - onim podcrtanim riječima na koje samo morate kliknuti da biste bili odbačeni na neku drugu stranicu. U XML-u je mehanizam hiperveze također uvelike poboljšan. Specifikacija XML povezivanja, nazvana XLink, koju W3C priprema do kraja godine, omogućit će korisniku da bira između više odredišta. Druga vrsta hiperveze omogućit će vam primanje teksta ili slike izravno na mjestu klika, dopuštajući posjetitelju da ne napusti stranicu.

Možda će najkorisniji dio XLinka biti dio specifikacije koji omogućuje autorima da pribjegnu neizravnim poveznicama, šaljući umjesto samih stranica u neku vrstu sažete baze podataka. Dakle, ako je autor promijenio adresu stranice, jednostavnim uređivanjem jednog unosa u takvoj bazi podataka, lako je ažurirati sve poveznice koje vode na njegovu stranicu. To će vam omogućiti da se riješite sve češćih poruka "404 datoteka nije pronađena" koje označavaju "pokvarenu" vezu.

Kombinacija učinkovitije obrade, preciznijeg pretraživanja i fleksibilnijeg povezivanja revolucionizirat će strukturu Weba i otvoriti potpuno nove metode pristupa informacijama. Za korisnike će ova nova mreža biti znatno brža, snažnija i korisnija od današnje mreže.


Potrebna suradnja

Naravno, nije sve tako jednostavno.

XML omogućuje svakome da dizajnira novi jezik na vlastiti način, ali stvaranje dobrog jezika zadatak je čiju težinu ne treba podcjenjivati.

Smišljanje jezika samo je početak: naivno je očekivati ​​da će značenja vaših oznaka biti očigledna drugim ljudima sve dok ne date priručnik za taj jezik i da će biti jasna računalima dok ne napišete programe koji rade s oznakama jezika .

A takvih će dogovora biti, budući da rastuća nekompatibilnost računalnih platformi rezultira kašnjenjem rokova, financijskim gubicima i dovodi do zabune u gotovo svim područjima djelovanja. Ljudi žele razmjenjivati ​​ideje i obavljati stvari, bez obzira na to što svi imaju različita računala - a da bi to postalo stvarnost, međusobni razvoj privatnih (za različita područja djelovanja) jezika još je dug put . Međutim, nalet novih akronima koji završavaju na "ML" pokazuje nepobitno inovativni duh koji je XML donio u znanost, poslovanje i obrazovanje.

Prilikom stvaranja novog XML jezika za označavanje, njegovi kreatori moraju se složiti oko tri stvari: koje će oznake biti tamo, kako se mogu ugnijezditi jedna u drugu i kako bi se trebale obrađivati. Prve dvije točke - jezični rječnik i struktura - sada su kodirane pomoću DTD (Definicija tipa dokumenta). XML standard ne obvezuje programere jezika da pribjegnu DTD-ovima, ali će većina novih jezika očito imati DTD opise - to programerima olakšava pisanje programa koji razumiju ovu oznaku i izvlače nešto smisleno iz nje. Trebat će nam i skupovi priručnika koji opisuju značenja svih oznaka na ljudskom jeziku. Na primjer, HTML ima DTD opis, ali postoje i stotine stranica poznatih HTML priručnika koje programeri koriste kada razvijaju preglednike i druge programe za Web.


Esej o stilu

Korisnicima je najvažnije što program može, a ne ono što je napisano u njegovom opisu. Općenito, ljudi više vole da im programi dopuštaju da vide XML kodirane informacije u čitljivom obliku. Ali u samim XML oznakama ne postoji posebna oznaka koja označava. kako bi podaci trebali biti prikazani na ekranu ili ispisanom listu.

Za izdavače koji žele "pisati jednom i objaviti posvuda", najvažnije je "roditi" publikaciju i zatim je "pretočiti" u bezbroj vrsta publikacija, tiskanih i elektroničkih. XML im pomaže na sljedeći način: sadržaj je označen opisnim oznakama koje su neovisne o okruženju prikazivanja. Dalje, nakladnik može formalizirati pravila prezentacije u obliku tzv. stilske tablice, koje automatski "stiliziraju" njegov rad za različite uređaje i okruženja. Standard za takav XML jezik, razvijen za ove svrhe, zove se Extensible Stylesheet Language (XSL).

Najnovije verzije preglednika mogu čitati XML dokumente, odabrati odgovarajuće stilske datoteke i koristiti ih za sortiranje i formatiranje informacija na zaslonu. Čitatelj možda neće ni shvatiti da ima posla s XML-om, a ne s HTML-om, osim ako ne primijeti da su stranice s XML-om brže i jednostavnije za korištenje.

Osobe s oštećenjem vida također imaju koristi od načela objavljivanja XSL dokumenata, jer im XSL daje mogućnost čitanja XML-a na Brailleovom pismu ili glasom. Ove prednosti vrijede i za druge: na primjer, trgovačkom putniku koji želi surfati internetom iz udobnosti svog automobila vjerojatno bi bilo zgodno slušati stranice sa zvukom.

Iako su u početku jezgru Mreže činili znanstveni i obrazovni programi, današnja Mreža već je trgovina (ili, reklo bi se, komercijalna očekivanja), skladištenje goriva za brzi početak. Svi se sjećaju nedavne rezonancije izazvane porastom internetske prodaje, ali nije potrebno spominjati koliko brzo poslovni ljudi komuniciraju jedni s drugima na mreži. Protok robe velikih proizvođača traži automatizaciju na mreži. No, današnji poslovni dizajni oslanjaju se na složene međuprogramske interakcije, au praksi to vrlo loše funkcionira, jer uspjeh zahtijeva jednoobraznost procesnih procesa, što je još uvijek daleko od postignutog.

Ljudi su stoljećima uspješno poslovali razmjenom standardnih dokumenata: narudžbi, faktura, deklaracija, potvrda o primicima itd. itd.

Dokumenti su služili poslu i nitko nije zahtijevao da jedna uključena strana zna unutarnje funkcioniranje druge. Svaki dokument prikazan je točno onoliko koliko je trebao biti prikazan primatelju informacije, i ništa više. Čini se da je razmjena dokumenata najispravniji način poslovanja i na webu. Ali to uopće nije bio zadatak za koji je HTML stvoren.

Stoga bi Web poboljšan XML-om trebao postati brzo, prijateljsko i bolje mjesto za poslovanje za svoje korisnike. Webmasteri i web dizajneri trebaju još više XML-a. Vojske programera trebat će poznavanje novih XML jezika "u potpunosti".

I premda dani samoukih hakera [autori su mislili u najboljem smislu te riječi] još traju, njihova je populacija već ugrožena.

Web dizajner sutrašnjice mora biti vješt ne samo u stvaranju teksta i grafike, već iu izgradnji višeslojnih, međuovisnih sustava temeljenih na DTD-ovima, podatkovnim stablima, strukturama hiperveza, metapodacima i stilskim komponentama - snažnoj i naprednoj infrastrukturi druge generacije Weba.

Često se mnogi korisnici modernih računalnih sustava i softverskih proizvoda raznih vrsta susreću s datotekama s nastavkom .xml. Mnogi ljudi jednostavno nemaju pojma kakav je to dokument niti kako ga otvoriti. Sada ćemo razmotriti što je to i za što je potrebno.

Što je XML datoteka

Počnimo, možda, s činjenicom da je, sa stajališta suvremenih računalnih tehnologija i programa koji se koriste za izradu dokumenata ove vrste, riječ o tekstualnoj datoteci u kojoj su zapisane naredbe univerzalnog proširivog jezika za označavanje, što je prilično podsjeća na dobro poznati alat za označavanje HTML.

Tipično, XML datoteka sadrži opće informacije o objektu, koje su izražene opisno (više o tome kasnije). Što se tiče podataka pohranjenih u takvim spremnicima, to mogu biti baze podataka koje se često koriste za video i audio kataloge na Internetu, spremljene korisničke postavke za programe i aplikacije, kao i cijele web stranice.

Kao primjer možete uzeti, recimo, audio album nekog izvođača. XML datoteka uključuje informacije o godini izdanja, žanru, broju i nazivima pjesama, popularnosti itd. Međutim, kada posjećuje resurse na World Wide Webu, surfer ne mora razmišljati o fizičkom otvaranju takve datoteke s informacijama, jer čak i kada svirate pjesmu online u playeru. Svi će podaci biti prikazani slično onima sadržanim u standardnim MP3 datotekama u obliku ID3 oznaka. Informacije se učitavaju na pjesmu koja se reproducira.

XML vrsta datoteke

Ne govorimo o osnovnim naredbama samog jezika, budući da prosječnom korisniku takve informacije nisu potrebne. Jedino što se može primijetiti jest da određeni iznos Elementi koji se koriste za opisivanje objekta ne postoje u ovom formatu: koliko ih je potrebno, toliko ih je navedeno.

Kako otvoriti standardni XML format

Pogledajmo sada kako otvoriti XML datoteku. Kao što su mnogi vjerojatno već shvatili, ovo je tekstualna datoteka, što znači da je najlakši način da koristite bilo koji uređivač, čak i najprimitivniji, da ga pregledate ili uredite. Da, barem isti "Notepad" iz standardnog Windows skupa.

Međutim, ovdje sve nije tako jednostavno. Činjenica je da dvostruki klik na datoteku bez postavljanja odgovarajuće povezanosti s bilo kojim programom neće se otvoriti. U najbolji mogući scenarij sustav će ponuditi popis najprikladnijih aplikacija. Možete odabrati program po vlastitom izboru, a pritom označiti okvir pored opcije da se odabrana aplikacija stalno koristi za sve datoteke ove vrste.

Možete to učiniti i drugačije tako da desnom tipkom miša kliknete na datoteku i odaberete naredbu "Otvori s...", nakon čega ponovno odaberete željenu aplikaciju ili s popisa ili odredite mjesto glavne izvršne komponente (većina često je to EXE datoteka).

Treći način otvaranja XML datoteke je prvo pokretanje programa, a zatim korištenje izbornika za otvaranje datoteke (u većini slučajeva to je Ctrl + O). U ovom slučaju apsolutno nije potrebno koristiti Notepad. Molimo, datoteka se otvara bez problema u istoj Word aplikaciji i sličnim. Čak i Microsoft Excel može otvoriti podatke u ovom formatu.

Međutim, ako postoji potreba za uređivanjem XML formata, onda je bolje koristiti profesionalne uslužne programe koji podržavaju jezičnu sintaksu, na primjer, Oxygen XML Editor, XML Marker ili EditiX Lite Version. Naravno, ovo nisu svi uslužni programi koji mogu raditi s jezikom datoteke vrhunska razina. Danas možete pronaći puno takvih programa.

Sada nekoliko riječi o tome zašto se ponekad prilikom otvaranja pojavljuje pogreška XML datoteke. Najčešće je to zbog povrede integriteta same datoteke, kao i netočnog uvođenja opisnih atributa ili oznaka. Osim toga, Excel ima ograničenje broja redaka koji se mogu prikazati, tako da u ovom slučaju podaci možda neće biti potpuni kada se otvore.

Moguće pogreške prilikom otvaranja XML datoteke kao privitka e-pošte

Ponekad se mogu pojaviti pogreške kada pokušate otvoriti datoteku koja je privitak e-pošte. Najčešće se to odnosi na standardne klijente e-pošte kao što je Outlook Express.

Činjenica je da se privitak prvo sprema kao privremeni podatak (vrlo često s dodatnim .tmp dodanim glavnoj ekstenziji), te se njemu pristupa.

Da biste izbjegli ovu situaciju, jednostavno prvo trebate spremiti privitak u izvornom formatu na bilo koje prikladno mjesto na disku ili prijenosnom mediju, a zatim koristiti standardne metode opisane gore.

Umjesto ukupnog

Kao što vidite, nema ništa teško razumjeti strukturu i metode otvaranja datoteka ovog formata. Ovdje, međutim, pitanje stvaranja XML podataka nije temeljno razmatrano, budući da za potpuno razumijevanje procesa morate poznavati barem osnove samog jezika. Inače, mislim da korisnici neće imati poteškoća s datotekama ovog formata.

Extensible Markup Language (XML). To su zapravo samo tekstualne datoteke koje koriste prilagođene oznake za opisivanje strukture i drugih funkcija dokumenta.

Što je XML

XML je označni jezik koji je stvorio World Wide Web Consortium (W3C) za definiranje sintakse za kodiranje dokumenata koje mogu čitati ljudi i strojevi. To čini pomoću oznaka, koje definiraju strukturu dokumenta, kao i način na koji dokument treba biti pohranjen i transportiran.

Najlakši način da ga usporedite s drugim označnim jezikom koji vam je možda poznat je označavanje hiperteksta(HTML) koji se koristi za kodiranje web stranica. HTML koristi unaprijed definirani skup znakova za označavanje (kratkih kodova) koji opisuju format sadržaja na web stranici.

Međutim, razlika u odnosu na XML je u tome što je proširiv. XML nema unaprijed definirani označni jezik kao HTML. Umjesto toga, XML omogućuje korisnicima stvaranje vlastitih znakova za označavanje za opisivanje sadržaja, stvarajući neograničen i samodefinirajući skup znakova.

U biti, HTML je jezik koji se fokusira na predstavljanje sadržaja, dok je XML namjenski jezik za opis podataka koji se koristi za pohranu podataka.

XML se često koristi kao osnova za druge formate dokumenata, kojih ima na stotine. Evo nekoliko koje biste mogli znati:

  • RSS i ATOM opisuju kako aplikacije trebaju rukovati web izvorima.
  • Microsoft .NET koristi XML za svoje konfiguracijske datoteke.
  • Microsoft Office koristi XML kao osnovu za strukturu dokumenta.

Dakle, ako imate XML datoteku, ona vam ne mora nužno reći za koju je aplikaciju. Međutim, ne morate brinuti o tome osim ako ne razvijate XML datoteke.

Kako otvoriti XML datoteku

Postoji nekoliko načina za izravno otvaranje XML datoteke. Možete ih otvarati i uređivati ​​u bilo kojem uređivaču teksta, pregledavati u bilo kojem web-pregledniku ili koristiti web-mjesto koje vam omogućuje pregled, uređivanje, pa čak i pretvaranje u druge formate.

Koristite uređivač teksta kada redovito radite s XML-om

Budući da su XML datoteke jednostavno tekstualne datoteke, mogu se otvoriti u bilo kojem uređivaču teksta. Međutim, mnogi uređivači teksta, poput Notepada, jednostavno nisu dizajnirani za prikaz XML datoteka s njihovom ispravnom strukturom. Ovo može biti korisno za brzo upoznavanje sa sadržajem XML datoteke. Ali postoje prikladniji alati za rad s njima.


Korištenje web-preglednika za pregled XML datoteke

Ako ne trebate uređivati ​​XML datoteku, već samo želite pogledati sadržaj, vaš preglednik može riješiti ovaj zadatak. Štoviše, vaš web preglednik je najvjerojatnije već konfiguriran kao standardni lijek pregledavanje XML datoteka. Dakle, dupli klik na XML datoteku trebao bi je otvoriti u pregledniku.

Ako nije, možete desnom tipkom miša kliknuti datoteku kako biste pronašli opcije za otvaranje bilo kojom drugom aplikacijom. Jednostavno odaberite svoj web preglednik s popisa programa.

Kada se datoteka otvori, trebali biste vidjeti dobro strukturirane podatke. Nije tako lijep kao boja koju imate u Notepad++, ali je puno bolji od notepada.

Korištenje mrežnog uređivača za XML datoteke

Ako želite urediti nasumičnu XML datoteku i ne želite preuzeti novu uređivač teksta, ili trebate pretvoriti xml datoteku u drugi format Postoji nekoliko pristojnih mrežnih XML uređivača dostupnih besplatno.

TutorialsPoint.com, XMLGrid.net i CodeBeautify.org - Omogućuju pregled i uređivanje XML datoteka. Nakon dovršetka uređivanja možete preuzeti izmijenjenu XML datoteku ili je čak pretvoriti u drugi format.

Na primjer, koristimo CodeBeautify.org. Stranica je podijeljena u tri dijela. S lijeve strane je XML datoteka s kojom radite. U sredini ćete pronaći nekoliko funkcija. S desne strane vidjet ćete rezultate nekih opcija koje možete odabrati.

Na primjer, na slici ispod, naša kompletna XML datoteka je na lijevoj strani, a okno s rezultatima prikazuje prikaz stabla jer smo kliknuli gumb Prikaz stabla u sredini.

Upotrijebite gumb Pregledaj za učitavanje XML datoteke s vašeg računala ili gumb Učitaj URL za dohvaćanje XML-a s mrežnog izvora

Gumb Tree View prikazuje podatke u dobro formatiranoj strukturi stabla u oknu s rezultatima, sa svim oznakama označenim narančastom bojom i atributima s desne strane oznaka.

Beatify prikazuje vaše podatke u urednom, lako čitljivom formatu.

Gumb Minify prikazuje vaše podatke koristeći što je moguće manje razmaka. Ova funkcija će svaki podatak smjestiti u jednu liniju. Ovo će vam dobro doći kada pokušavate smanjiti datoteku, što će uštedjeti prostor.

Konačno, možete koristiti gumb XML u JSON za pretvaranje XML u JSON format i gumb Izvezi u CSV za spremanje podataka kao datoteku s vrijednostima odvojenim zarezima ili gumb Preuzmi za preuzimanje svih promjena koje ste napravili u novom XML datoteka.

Jezik XML već je privukao dosta pozornosti programera i korisnika Interneta. Danas broj pristaša ove nove tehnologije raste jednako brzo kao i broj izvješća o sljedećim preprekama koje je svladala na putu sveopćeg priznanja. Unatoč činjenici da je XML vrlo mlad (međunarodna organizacija W3C odobrila je specifikaciju "Extensible Markup Language (XML) 1.0" prije nešto manje od godinu dana - početkom veljače 1998.) i da su pojedine komponente ovog jezika još uvijek u doradi, novi već se danas pojavljuju jezici, stvoreni na temelju XML-a, pojavljuju se brojni web poslužitelji koji ovu tehnologiju koriste za organiziranje informacija pohranjenih na njima. Internetski svijet oko nas ponovno se transformira, a sudionici tog procesa možemo postati već danas

Svrha ovog članka je na konkretnim primjerima pokušati prikazati neke od mogućnosti XML-a te odgovoriti na brojna pitanja koja se često javljaju pri upoznavanju novog jezika. Što je XML? Koje su njegove prednosti u odnosu na HTML jezik koji nam je već poznat? Možete li danas koristiti XML na svojim web stranicama? A ako je moguće, kako onda?

Na kraju članka nalaze se poveznice na druge internetske resurse, uz pomoć kojih također možete dobiti potpunije informacije o specifičnim pitanjima koja vas zanimaju vezana uz korištenje XML-a, a koja nisu obuhvaćena ovim člankom. Potpune specifikacije za XML i srodne jezike dostupne su na službenoj W3C stranici -

Zašto nam je potreban novi označni jezik?

Mnogo jednostavniji i praktičniji od SGML-a, HTML jezik vam omogućuje određivanje dizajna elemenata dokumenta i ima određeni ograničeni skup uputa - oznaka, uz pomoć kojih se provodi proces označavanja. HTML instrukcije prvenstveno su namijenjene kontroli procesa prikaza sadržaja dokumenta na ekranu klijentskog programa i time određuju način prikaza dokumenta, ali ne i njegovu strukturu. Element hipertekstualne baze podataka, opisan HTML-om, je tekstualna datoteka koja se lako može prenijeti preko mreže koristeći HTTP protokol. Ova značajka, kao i činjenica da je HTML otvoreni standard i ogroman broj korisnika ima priliku koristiti mogućnosti ovog jezika za dizajn svojih dokumenata, svakako je utjecala na rast popularnosti HTML-a i učinila ga danas glavnim mehanizam za predstavljanje informacija na webu

Međutim, moderne aplikacije zahtijevaju ne samo jezik za prezentaciju podataka na zaslonu klijenta, već i mehanizam koji vam omogućuje da odredite strukturu dokumenta i opišete elemente koje sadrži. HTML ima jednostavan skup naredbi i prilično se uspješno nosi sa zadatkom opisivanja tekstualnih informacija i njihovog prikazivanja na zaslonu preglednika preglednika. Međutim, sami prikazani podaci nisu ni na koji način povezani s oznakama koje se koriste za oblikovanje, tako da programi za raščlanjivanje nemaju mogućnost korištenja HTML oznaka za pronalaženje dijelova dokumenta koji su nam potrebni. one. naišavši npr. na takav opis

ruža,

gledatelj će znati kojom bojom prikazati tekst sadržan unutar oznaka i vjerojatno će ga ispravno prikazati, ali apsolutno je svejedno gdje se u dokumentu ova oznaka nalazi, u kojim drugim oznakama je trenutačni fragment zatvoren, postoje li fragmenti ugniježđeni u njemu ili jesu li odnosi između objekata izgrađeni ispravno. Ova "ravnodušnost" prema strukturi dokumenta dovodi do činjenice da se pretraživanje ili analiza informacija unutar njega neće razlikovati od rada s kontinuiranom tekstualnom datotekom koja nije razbijena na elemente. A ovo, kao što znate, nije najučinkovitiji način rada s informacijama.

Drugi značajan nedostatak HTML-a je ograničen skup njegovih oznaka. DTD pravila za HTML definiraju fiksni skup deskriptora i stoga programer nema mogućnost unosa vlastitih, posebnih oznaka. Iako se s vremena na vrijeme pojavljuju nova jezična proširenja (danas je najnovija verzija HTML-a HTML 4.0), dugi put do njihove standardizacije, popraćen stalnim nesuglasicama između glavnih proizvođača preglednika, čini gotovo nemogućom brzu prilagodbu jezika, njegovu upotrebu za prikaz specijaliziranih informacija (na primjer, multimedijskih, matematičkih, kemijskih formula itd.).

Da rezimiramo sve što je rečeno, može se tvrditi da HTML danas ne zadovoljava u potpunosti zahtjeve koje moderni programeri postavljaju pred jezike ova vrsta. Zamijenio ga je novi jezik za označavanje hiperteksta, moćan, fleksibilan i, u isto vrijeme, praktičan XML jezik. Koje su njegove prednosti?

XML ( Extensible Markup Language) je označni jezik koji opisuje cijelu klasu podatkovnih objekata koji se nazivaju XML dokumenti. Ovaj jezik se koristi kao sredstvo za opisivanje gramatike drugih jezika i kontrolu ispravnosti dokumenata. one. Sam XML ne sadrži nikakve označne oznake, on jednostavno definira redoslijed kojim su stvorene. Tako, ako, na primjer, smatramo da označava element ruža dokument mora koristiti oznaku ;, tada nam XML omogućuje slobodnu upotrebu oznake koju definiramo, au dokument možemo uključiti fragmente poput sljedećih:

ruža

Skup oznaka može se lako proširiti. Ako, pretpostavimo, također želimo naznačiti da bi opis cvijeta trebao smisleno ići unutar opisa staklenika u kojem cvjeta, tada jednostavno postavljamo nove oznake i biramo redoslijed kojim se pojavljuju:

ruža

Ako tamo želimo posaditi još nekoliko cvjetova, moramo napraviti sljedeće promjene:

ruža lala kaktus

Kao što možete vidjeti, proces kreiranja XML dokumenta je vrlo jednostavan i zahtijeva od nas samo osnovno znanje o HTML-u i razumijevanje zadataka koje želimo obaviti korištenjem XML-a kao jezika za označavanje. To programerima daje jedinstvenu mogućnost definiranja prilagođenih naredbi koje im omogućuju najučinkovitije definiranje podataka sadržanih u dokumentu. Autor dokumenta kreira njegovu strukturu, gradi potrebne veze među elementima, koristeći one naredbe koje zadovoljavaju njegove zahtjeve i postiže vrstu označavanja koja mu je potrebna za obavljanje operacija pregledavanja, pretraživanja i analize dokumenta.

Još jedna očita prednost XML-a je mogućnost da se koristi kao univerzalni jezik upita za repozitorije informacija. Danas se u dubinama W3C-a razmatra radna verzija XML-QL (ili XQL) standarda, koji bi u budućnosti mogao postati ozbiljan konkurent SQL-u. Osim toga, XML dokumenti mogu djelovati kao jedinstveni način pohranjivanja podataka koji uključuje i sredstva za analizu informacija i njihovo predstavljanje na strani klijenta. U ovom području jedno od obećavajućih područja je integracija Java i XML tehnologija, što omogućuje korištenje snage obiju tehnologija pri izgradnji aplikacija neovisnih o stroju koje također koriste univerzalni format podataka za razmjenu informacija.

XML također omogućuje kontrolu ispravnosti podataka pohranjenih u dokumentima, provjeru hijerarhijskih odnosa unutar dokumenta i uspostavljanje jedinstvenog standarda za strukturu dokumenata, čiji sadržaj mogu biti različiti podaci. To znači da se može koristiti pri izgradnji složenih informacijskih sustava, u kojima je vrlo važno pitanje razmjene informacija između različitih aplikacija koje rade u istom sustavu. Stvaranjem strukture za mehanizam razmjene informacija na samom početku rada na projektu, menadžer se u budućnosti može spasiti od mnogih problema povezanih s nekompatibilnošću formata podataka koje koriste različite komponente sustava.

Također, jedna od prednosti XML-a je što programi za obradu XML dokumenata nisu komplicirani, a već su se pojavili i slobodno distribuiraju razni programski proizvodi namijenjeni za rad s XML dokumentima. XML je danas podržan u Microsoft Internet Exploreru 4/0 i beta verzijama IE5. Najavljeno je da će biti podržan u sljedećim verzijama aplikacija Netscape Communicator, Oracle DBMS, DB-2 i MS-Office. Sve to daje razloga za pretpostavku da će najvjerojatnije u bliskoj budućnosti XML postati glavni jezik za razmjenu informacija za informacijske sustave, čime će zamijeniti HTML. Dobro poznati specijalizirani označni jezici kao što su SMIL, CDF, MathML, XSL već su stvoreni na temelju XML-a, a popis radnih nacrta novih jezika koje W3C razmatra stalno raste.

Kako izgleda XML dokument?

Prvi Drugi podstavak 1 Treći Trajati

Pravila za izradu XML dokumenta

RusijaNovosibirsk</country>

Jezični konstrukti

Elementi podataka

ruža Novosibirsk ruža Novosibirsk Sibir Novosibirsko državno tehničko sveučilište
vrlo dobar institut Novosibirsko državno sveučilište
nije ni loše

XML shema je moćnija od DTD-a.

Podrška za vrste podataka XML Schema

Jedan od najvažnijih je mogućnost podrške za tipove podataka XML Schema.

Zahvaljujući podršci za vrstu podataka:

  • Može lako opisati važeći sadržaj dokumenta
  • Možda je lakše provjeriti jesu li podaci točni
  • Možete lakše raditi zajedno s podacima iz baze podataka
  • Podaci se mogu lakše definirati ograničenjima (podatkovni aspekti)
  • Model podataka (ili format podataka) može se jednostavno definirati
  • Može biti lakše pretvoriti podatke između različitih vrsta podataka

Napomena urednika: Ograničenja podataka ili određeni aspekti su izraz prototipa XML sheme, kineski se može prevesti kao "lice", koristi se za ograničavanje važeća vrijednost vrsta podataka.

XML sheme koje koriste XML sintaksu

Još jedan važna značajka XML sheme su da su napisane u XML-u.

XML pisanje XML sheme ima mnoge prednosti:

  • Bez potrebe za učenjem novog jezika
  • Možete koristiti XML editor za uređivanje datoteka sheme
  • Možete koristiti XML parser za analizu datoteka sheme
  • Shema se može prikazati pomoću XML DOM-a
  • Shema se može pretvoriti pomoću XSLT-a

XML shema može osigurati prijenos podataka

Kada se podaci prenose od pošiljatelja do primatelja, poanta je da obje strane moraju poštovati sadržaj istih "očekivanja".

U XML shemi, pošiljatelj i primatelj mogu razumjeti način na koji su podaci opisani.

Podaci poput "03.11.2004" u nekim se zemljama mogu protumačiti kao 3. studeni, dok je u drugim zemljama to 11. ožujka.

Međutim, XML tip podataka elementa je, na primjer:<дата типа = "дата"> 2004-03-11 kako bi se osiguralo dosljedno razumijevanje sadržaja, budući da XML tip podataka "datum" zahtijeva format "GGGG-MM-DD".

XML shema se može proširiti

XML sheme su proširive jer su napisane u XML-u.

Definicijom proširive sheme možete:

  • Ponovno korištenje vaše sheme u drugoj shemi
  • Izgrađen sa standardnim tipovima izvedenim iz vaših vlastitih tipova podataka
  • Sheme više veza u jednom dokumentu

Dobra forma nije dovoljna

Ovaj smo dokument nazvali usklađivanjem s XML sintaksom dobro oblikovanih XML dokumenata, kao što su:

  • Mora započeti XML deklaracijom
  • Mora imati jedinstveni korijenski element
  • Početna oznaka mora odgovarati završnoj oznaci
  • Elementi su osjetljivi na velika i mala slova
  • Svi elementi moraju biti zatvoreni
  • Svi elementi moraju biti pravilno ugniježđeni
  • Posebni znakovi moraju koristiti objekt

Čak ni dobar oblik dokumenta ne može jamčiti da neće sadržavati pogreške, a te pogreške mogu imati ozbiljne posljedice.

Razmotrite sljedeću situaciju: naručili ste 5 tuceta laserskih pisača, umjesto pet. U XML shemi većina ovih pogrešaka može se otkriti u vašem softveru za provjeru valjanosti.



Publikacije na temu