De ce este nevoie de acest XML? De ce avem nevoie de XML? De ce avem nevoie de un nou limbaj de marcare?

De ce este nevoie de acest XML?

[ÎN în ultima vreme, în legătură cu apariția acestor pagini, cele mai frecvente
Întrebarea pentru mine s-a dovedit a fi: „Spune-mi, de ce este nevoie deloc, XML?
HTML-ul nu este suficient pentru noi? „Neavând mult timp (sau inteligență;) să-mi pregătesc propriile publicații și, de asemenea, respectând profund clasicii, am preferat să traduc rapid un articol excelent pe tema titlului.
- poate că acesta este primul episod al serialului „a ajuta”]

Jon Bosak, Tim Bray
XML iar cel Web de a doua generație
de la Scientific American, mai 1999

Oferă oamenilor câteva sfaturi și ei își vor da seama de restul singuri. Privind pagina, unde blocurile mai mari de text sunt împărțite în altele mai mici, toată lumea realizează rapid că acesta este începutul unui articol. Privind lista de cumpărături, puteți ghici rapid că acestea sunt „instrucțiuni” pentru vizitarea magazinului. Când vezi coloanele de numere, înțelegi că acesta este un cont bancar.

Tocmai în acest scop - pentru a face informațiile autodescriptive - a fost inventat un nou limbaj de marcare a documentelor - Extensible Markup Language (XML). Aceste schimbări ușor de pronunțat (un document „autodescris”, o schimbare a regulilor de comunicare cu computerele) au un potențial enorm - rolul Internetului dintr-un mediu de livrare a informațiilor începe să se extindă la alte tipuri de activitate umană. Într-adevăr, de la aprobarea sa de către W3C în 1998, specificația XML a înregistrat rapid incendiu de pădure a început să pătrundă peste tot - în industrie și știință, în producția de bunuri și medicină.

Entuziaștii au sperat că XML va face posibilă rezolvarea unui număr de probleme globale Web. Aceste probleme sunt cunoscute: în primul rând, internetul, o rețea super-rapidă, se comportă adesea mai rău decât o țestoasă; și în al doilea rând, deși aproape toate informațiile sunt disponibile pe Internet, este adesea înnebunitor de dificil să găsești ceva necesar pe el.

Ambele probleme sunt cauzate în principal de natura limbajului principal al Web-ului - HTML. Și deși succesul HTML în comparație cu alte limbi propuse vreodată publicații electronice Este evident că HTML este prea rar: practic spune browserului cum să plaseze text, imagini și butoane pe pagină. HTML se concentrează pe prezentarea informațiilor și, prin urmare, este destul de ușor de învățat, dar are un cost.

Acest lucru se reflectă în complexitatea dezvoltării site-urilor web, cu excepția cazului în care aceste site-uri sunt menite să fie ca aparate de fax, trimițând pagini oricui solicită. Mai mult de jumătate dintre oameni și companii din întreaga lume ar prefera site-uri web care să primească comenzi de la utilizatori, să trimită diagnostice ale bolii și chiar să desfășoare operațiuni instrumentale delicate în fabrici și laboratoare științifice. Asemenea sarcini _NICIODATĂ_ au fost confruntate de HTML!.

De exemplu, chiar dacă medicul dumneavoastră este capabil să „extragă” testele luate de pe cardul dumneavoastră medical în vizualizatorul său, este puțin probabil ca el să le poată trimite prin rețea unui alt specialist pentru a introduce răspunsul primit înapoi în el. baza de date. Computerul lui nu știe ce să facă cu informațiile care sunt la fel de clare pentru el

albină albină

sau albină albină.
Legendarul Kernighan a remarcat odată că întregul truc al principiului WYSIWYG (ceea ce văd este ceea ce primesc) este că atunci când nu vezi nimic, de obicei reușești să obții exact aceeași sumă.

Cuvintele de mai sus care sunt incluse între paranteze unghiulare se numesc etichete. Nu există nicio etichetă de analiză în HTML și, prin urmare, celălalt dezavantaj: inflexibilitatea. Adăugarea unei noi etichete într-o limbă este o birocrație atât de birocratică încât durează atât de mult încât nimeni nu se va deranja cu ea. Dar ar fi bine ca fiecare program să aibă propriile etichete, nu doar cea din exemplul cu medicul.

Acest lucru explică în mare măsură ritmul lent actual al creării de magazine online, cataloage de comandă prin poștă și alte site-uri interactive. Dacă modificați numărul de unități de comandă și metoda de expediere și vedeți o mână de numere modificate în câmpul „suma”, va trebui totuși să cereți serverului de la distanță (deja suprasolicitat) să vă trimită înapoi o pagină completă nou generată cu grafica si orice altceva. În timp ce propriul tău computer puternic va rămâne inactiv pentru că tocmai a învățat ceva de genul

Şi , dar nu și prețuri cu opțiuni de livrare.

Adăugați la aceasta calitatea slabă a capabilităților de căutare pe Web. Deoarece nu există nicio modalitate de a marca în mod specific informațiile despre preț, este absolut imposibil să căutați pagini pe web pe baza „prețului”.


Ceva vechi, ceva nou

În principiu, soluția este simplă: etichetele trebuie să indice ce fel de informații sunt, și nu cum ar trebui să arate. De exemplu, marcați componentele unei comenzi pentru o cămașă cu etichetele „preț, mărime, cantitate, culoare” în loc de „aldine, paragraf, rând, coloană”, așa cum se sugerează în HTML. Atunci este mai ușor pentru program să identifice documentul ca o comandă și să facă restul muncii: afișați această comandă într-o formă sau alta, treceți-o prin sistemul de contabilitate sau asigurați-vă că noua cămașă este livrată la ușa dvs. a doua zi.

Noi, grup de lucru W3C, în 1996, a început să dezvolte un astfel de proiect. Ideea a fost puternică, deși nu în întregime originală. De generații, editorii și tipografii au marcat textele scrise de mână cu semnele de tipar. Un astfel de „limbaj de marcare” s-a dezvoltat independent până în 1986, când, în urma a zece ani de muncă, Organizația Internațională pentru Standardizare (ISO) a introdus un sistem pentru crearea de noi limbaje de marcare.

Denumit SGML (Standard Generalized Markup Language), acest limbaj de descriere a limbajului - un metalimbaj - și-a dovedit utilitatea în multe sisteme mari de publicare. Și chiar și HTML a primit definiția prin SGML. Singura dificultate cu SGML a fost că era omnivor - existau o mulțime de lucruri inteligente acolo pentru a minimiza apăsările de taste, deoarece în acel moment fiecare octet conta. De aceea, browserele web de astăzi nu funcționează bine cu el.

În crearea XML, grupul nostru de lucru a dezbrăcat SGML de cojile sale și a propus un metalimbaj extrem de țintit și digerabil. Baza XML este un set de reguli, ghidate de care oricine își poate crea propriul limbaj de marcare.


<имя пациента>Aceste reguli sunt alese astfel încât un singur program mic (numit și parser sau analizor de sintaxă) să poată face față recunoașterii oricărui limbaj nou. Să ne uităm din nou la exemplul unui medic care ar dori să transfere testele unui specialist. Dacă profesioniștii din domeniul medical ar crea propriul limbaj de marcare din XML pentru a codifica notițele medicului (un număr de grupuri lucrează la problemă de mult timp), atunci mesajul unui medic către colegul său ar putea conține ceva de genul
<аллергия на лекарство>bla bla

bla bla bla

În această setare, nu mai este dificil să scrieți un program pentru un computer arbitrar, astfel încât acesta să poată recunoaște aceste fișe medicale standardizate și să poată introduce aceste informații literalmente vitale în baza sa de date.

Așa cum HTML a fost conceput pentru a permite oricui să citească documente de pe Internet, XML ne oferă un Esperanto pe care oricine îl poate citi și scrie, în ciuda unei babele de platforme incompatibile. Da, chiar și din punctul de vedere al unei persoane obișnuite, XML are o încărcătură semantică mai mare (spre deosebire de alte formate de date), pentru că nu există nimic în el care să arate ca un text ilizibil.

Regula de imbricare impune automat simplitatea în orice document XML, producând o structură cunoscută în informatică ca arbore. Similar unui arbore genealogic, orice element grafic sau text al unui document este tatăl, fiul sau fratele (părinte, copil, frate) al unui alt element, iar această relație este întotdeauna unică. Desigur, arborii nu descriu întreaga varietate de structuri de date, dar acopera majoritatea cazurilor tipice de utilizare a computerului. În plus, arborii sunt extrem de convenabil pentru programatori. Nu există nicio problemă în a scrie o mică bucată de cod pentru a reordona tranzacțiile sau pentru a afișa o chitanță complet ușor de înțeles atunci când chitanța este reprezentată ca un arbore.

A doua sursă de putere universală a XML este dependența acestuia de noul standard Unicode, un sistem de codare care permite amestecarea textului în toate limbile majore ale lumii. Dimpotrivă, în HTML, ca și în majoritatea procesoarelor de text, un document, de regulă, poate fi doar într-o singură limbă, indiferent care - engleză, japoneză sau arabă.
Și dacă programul nu cunoaște codificarea unui anumit limbaj, puteți uita de document (în HTML). Poate fi și mai rău: de exemplu, din cauza inconsecvenței codificărilor, programele scrise în Taiwan adesea nu pot citi texte care vizează China continentală. În cazul XML, dacă programul știe să lucreze corect cu acesta, poate gestiona orice combinație de codificări.


Astfel, XML nu numai că permite schimbul de date între diferite platforme informatice, dar face și posibilă depășirea barierelor naționale și culturale.

Sfârșitul așteptării la nivel mondial

Pentru a ilustra, imaginați-vă că folosiți o agenție de turism online pentru a găsi un zbor de la Londra la New York pe 4 iulie. Cel mai probabil, veți vedea o listă de câteva ori mai lungă decât poate încăpea pe ecran. Această listă poate fi scurtată prin setarea unor parametri mai precisi precum ora de plecare, prețul sau compania aeriană, dar în acest caz pur și simplu „încărcați” serverul agenției de turism cu solicitarea dumneavoastră și trebuie să așteptați un răspuns. Cu toate acestea, dacă această listă lungă de zboruri ți-ar fi furnizată în XML, atunci biroul ar putea să o însoțească cu un mic applet Java, cu ajutorul căruia le poți sorta și filtra instantaneu și ușor pe cele inutile, fără a apela la nicio interacțiune. cu serverul.

Înmulțiți acest lucru cu milioane de utilizatori web, iar efectul general este impresionant.

Cu cât mai multe informații online sunt etichetate cu etichete XML specifice industriei, cu atât va fi mai ușor să găsiți ceea ce căutați. Astăzi, o căutare pe internet pentru „locuri de muncă pentru un agent de bursă” vă va copleși cu o avalanșă de reclame, dar probabil că vor fi doar câteva dintre ele pentru muncă - cea mai mare parte a muncii este ascunsă pe panouri gratuite ale site-urilor de ziare care caută roboți. nu-mi place să lucrez cu.

Și acum, Asociația Ziarelor din America își creează propriul limbaj de markup publicitar în XML, care promite să facă procesul de căutare mult mai eficient.

Desigur, informațiile pot fi obținute fără a căuta. La urma urmei, Web-ul este hipertext - miliarde de pagini pline de hyperlinkuri - acele cuvinte subliniate pe care trebuie doar să faceți clic pentru a fi transportat pe altă pagină. În XML, mecanismul hyperlink este, de asemenea, mult îmbunătățit. Specificația de legătură XML, numită XLink, pe care W3C o pregătește până la sfârșitul anului, va permite utilizatorului să aleagă din mai multe destinații. Un alt tip de hyperlink vă va permite să primiți text sau o imagine direct în punctul de a face clic, permițând vizitatorului să nu părăsească pagina.

Poate cea mai utilă parte a XLink va fi partea din specificație care permite autorilor să recurgă la link-uri indirecte, trimițând în locul paginilor în sine la un fel de bază de date rezumat. Deci, dacă autorul a schimbat adresa paginii, prin simpla editare a unei intrări într-o astfel de bază de date, este ușor să actualizezi toate linkurile care duc către pagina sa. Acest lucru vă va ajuta să scăpați de mesajele din ce în ce mai frecvente „404 File Not Found” care indică un link „întrerupt”.

Combinația dintre o procesare mai eficientă, o căutare mai precisă și o legătură mai flexibilă va revoluționa structura Web-ului și va deschide metode complet noi de accesare a informațiilor. Pentru utilizatori, această nouă rețea va fi semnificativ mai rapidă, mai puternică și mai utilă decât rețeaua de astăzi.


Este nevoie de cooperare

Desigur, nu totul este atât de simplu.

XML permite oricui să proiecteze un nou limbaj în felul său, dar crearea unui limbaj bun este o sarcină a cărei dificultate nu trebuie subestimată.

A veni cu o limbă este doar începutul: este naiv să te aștepți ca semnificațiile etichetelor tale să fie evidente pentru alți oameni până când oferi un manual pentru limba și să fii clar pentru computere până când scrii programe care funcționează cu etichetele limbii. .

Și vor exista astfel de acorduri, întrucât incompatibilitatea tot mai mare a platformelor informatice are ca rezultat întârzieri în termene, pierderi financiare și duce la confuzie în aproape toate domeniile de activitate. Oamenii vor să facă schimb de idei și să facă lucrurile, indiferent de faptul că fiecare are computere diferite - și pentru ca acest lucru să devină realitate, dezvoltarea reciprocă a limbilor private (pentru diferite domenii de activitate) mai are un drum lung de parcurs. . Cu toate acestea, valul de acronime noi care se termină în „ML” demonstrează spiritul incontestabil inovator pe care XML l-a adus în știință, afaceri și educație.

Când creează un nou limbaj de marcare XML, creatorii săi trebuie să convină asupra a trei lucruri: ce etichete vor fi acolo, cum pot fi imbricate unele în altele și cum ar trebui procesate. Primele două puncte - dicționar de limbă și structură - sunt acum codificate folosind DTD (Document Type Definition). Standardul XML nu obligă dezvoltatorii de limbi să recurgă la DTD-uri, dar majoritatea limbilor noi se pare că vor avea descrieri DTD - acest lucru le face mai ușor pentru programatori să scrie programe care să înțeleagă acest marcaj și să extragă ceva semnificativ din el. De asemenea, vom avea nevoie de seturi de manuale care să descrie semnificațiile tuturor etichetelor în limbajul uman. De exemplu, HTML are o descriere DTD, dar există și sute de pagini de manuale HTML familiare pe care programatorii le consultă atunci când dezvoltă browsere și alte programe pentru Web.


Eseu despre stil

Pentru utilizatori, principalul lucru este ceea ce poate face programul și nu ceea ce este scris în descrierea acestuia. În general, oamenii preferă ca programele să le permită să vadă informațiile codificate XML într-o formă care poate fi citită. Dar în etichetele XML în sine nu există nicio indicație specială de marcare. cum trebuie prezentate datele pe un ecran sau pe o foaie tipărită.

Pentru editorii care caută să „scrie o dată și să publice peste tot”, cel mai important lucru este „să dea naștere” unei publicații și apoi să o „toarne” într-o multitudine de tipuri de publicații, atât tipărite, cât și electronice. XML îi ajută în acest fel: conținutul este marcat cu etichete descriptive care sunt independente de mediul de randare. În continuare, editorul poate oficializa regulile de prezentare sub formă de așa-numite. foi de stil, care „stilează” automat munca lui pentru diferite dispozitive și medii. Standardul pentru un astfel de limbaj XML, dezvoltat în aceste scopuri, se numește Extensible Stylesheet Language (XSL).

Cele mai recente versiuni ale browserului pot citi documente XML, pot selecta fișierele de stil adecvate și le pot folosi pentru a sorta și formata informațiile de pe ecran. Cititorul poate să nu realizeze că are de-a face cu XML mai degrabă decât cu HTML, decât dacă observă că site-urile cu XML sunt mai rapide și mai ușor de utilizat.

Persoanele cu deficiențe de vedere beneficiază, de asemenea, în mod liber de principiile de publicare a documentelor XSL, deoarece XSL le oferă posibilitatea de a citi XML în Braille sau prin voce. Aceste avantaje se aplică și celorlalți: de exemplu, unui vânzător ambulant care dorește să navigheze pe internet din confortul mașinii sale probabil că ar considera destul de convenabil să asculte pagini cu sunet.

Deși la început nucleul Rețelei consta în programe științifice și educaționale, Rețeaua de astăzi este deja comerț (sau, s-ar putea spune, așteptări comerciale), stocând combustibil pentru un început rapid. Toată lumea își amintește de rezonanța recentă cauzată de creșterea vânzărilor online, dar inutil să spună cât de repede interacționează oamenii de afaceri între ei online. Fluxul de mărfuri de la marii producători cerșește automatizarea în rețea. Dar sistemele de afaceri de astăzi se bazează pe interacțiuni complexe program-la-program, iar în practică acest lucru funcționează foarte slab, deoarece succesul necesită uniformitate a proceselor de procesare, ceea ce este încă departe de a fi atins.

De secole, oamenii au făcut afaceri cu succes prin schimbul de documente standard: comenzi, facturi, declarații, chitanțe etc. etc.

Documentele au funcționat pentru afacere și nimeni nu a cerut ca o parte implicată să cunoască funcționarea interioară a celeilalte părți. Orice document a fost arătat exact cât ar fi trebuit să fie arătat destinatarului informațiilor și nu mai mult. Aparent, schimbul de documente este cel mai corect mod de a face afaceri și pe Web. Dar aceasta nu a fost deloc sarcina pentru care a fost creat HTML.

Astfel, Web-ul îmbunătățit cu XML ar trebui să devină un loc rapid, prietenos și mai bun pentru afaceri pentru utilizatorii săi. Webmasteri și designerii web au nevoie și de mai mult XML. Armatele de programatori vor avea nevoie de cunoștințe de noi limbaje XML „la maximum”.

Și deși vremurile hackerilor autoeducați [autorii au vrut să spună cel mai bun sens al acestui cuvânt] încă durează, populația lor este deja amenințată.

Designerul web de mâine trebuie să fie competent nu numai în producerea de text și grafică, ci și în construirea de sisteme multistratificate, interdependente, bazate pe DTD-uri, arbori de date, structuri de hyperlink, metadate și componente de stil - o infrastructură puternică și avansată a Web-ului de a doua generație.

Destul de des, mulți utilizatori de sisteme informatice moderne și produse software de diferite tipuri întâlnesc fișiere cu extensia .xml. Mulți oameni pur și simplu nu au idee despre ce fel de document este acesta sau cum să-l deschidă. Acum va fi luat în considerare, în același timp, vom afla ce este și pentru ce este necesar.

Ce este un fișier XML

Să începem, poate, cu faptul că, din punctul de vedere al tehnologiilor informatice moderne și al programelor folosite pentru a crea documente de acest tip, este un fișier text în care sunt scrise comenzile limbajului universal extensibil de marcare, ceea ce este destul de amintește de binecunoscutul instrument de marcare HTML.

De obicei, un fișier XML conține informații generale despre un obiect, care sunt exprimate descriptiv (mai multe despre asta mai târziu). În ceea ce privește datele stocate în astfel de containere, pot fi baze de date folosite adesea pentru cataloage video și audio pe Internet, preferințe salvate de utilizator pentru programe și aplicații, precum și pagini web întregi.

Ca exemplu, puteți lua, să zicem, un album audio al unui artist. Fișierul XML include informații despre anul lansării, genul, numărul și numele pieselor, popularitate etc. Cu toate acestea, atunci când vizitează resurse de pe World Wide Web, navigatorul nu trebuie să se gândească la deschiderea fizică a unui astfel de fișier de informații, deoarece chiar și atunci când redați o melodie online într-un player. Toate datele vor fi afișate similar cu cele conținute în fișierele MP3 standard sub formă de etichete ID3. Informațiile sunt încărcate pe piesa care este redată.

tip de fișier XML

Nu vorbim despre comenzile de bază ale limbajului în sine, deoarece utilizatorul obișnuit nu are nevoie de astfel de informații. Singurul lucru care poate fi remarcat este că o anumită sumă Elementele folosite pentru a descrie obiectul nu există în acest format: câte sunt necesare, atâtea sunt specificate.

Cum se deschide formatul XML standard

Acum să vedem cum să deschidem un fișier XML. După cum probabil mulți au înțeles deja, acesta este un fișier text, ceea ce înseamnă că cel mai simplu mod este să folosiți orice editor, chiar și cel mai primitiv, pentru a-l vizualiza sau edita. Da, cel puțin același „Notepad” din setul standard de Windows.

Totuși, aici nu este totul atât de simplu. Faptul este că dublu clic pe un fișier fără a seta asocierea corespunzătoare cu niciun program nu se va deschide. ÎN cel mai bun scenariu sistemul va oferi o listă cu cele mai potrivite aplicații. Puteți selecta un program la alegere și, în același timp, puteți bifa caseta de lângă opțiunea de a utiliza constant aplicația selectată pentru toate fișierele de acest tip.

O poți face diferit făcând clic dreapta pe fișier și apoi selectând comanda „Deschide cu...”, după care, din nou, selectează aplicația dorită fie din listă, fie specifică locația componentei executabile principale (cele mai multe adesea acesta este un fișier EXE).

A treia modalitate de a deschide un fișier XML este să lansați inițial programul și apoi să utilizați meniul de deschidere a fișierului (în majoritatea cazurilor acesta este Ctrl + O). În acest caz, nu este absolut necesar să utilizați Notepad. Vă rog, fișierul se deschide fără probleme în aceeași aplicație Word și altele similare. Chiar și Microsoft Excel este capabil să deschidă date în acest format.

Cu toate acestea, dacă este nevoie să editați formatul XML, atunci este mai bine să utilizați utilități profesionale care acceptă sintaxa limbajului, de exemplu, Oxygen XML Editor, XML Marker sau EditiX Lite Version. Desigur, acestea nu sunt toate utilitarele care pot funcționa cu limba fișierului în nivel superior. Astăzi puteți găsi o mulțime de astfel de programe.

Acum câteva cuvinte despre de ce uneori apare o eroare de fișier XML la deschidere. Cel mai adesea, acest lucru se datorează unei încălcări a integrității fișierului în sine, precum și introducerii incorecte a atributelor sau etichetelor descriptive. În plus, Excel are o limită a câte rânduri pot fi afișate, așa că în acest caz este posibil ca datele să nu fie complete atunci când sunt deschise.

Posibile erori la deschiderea unui fișier XML ca atașament de e-mail

Uneori pot apărea erori atunci când încercați să deschideți un fișier care este un atașament de e-mail. Cel mai adesea, acest lucru se aplică clienților de e-mail standard precum Outlook Express.

Faptul este că atașamentul este mai întâi salvat ca date temporare (foarte des cu un .tmp suplimentar adăugat la extensia principală) și acesta este cel care este accesat.

Pentru a evita această situație, trebuie pur și simplu să salvați inițial atașamentul în formatul său original în orice locație convenabilă de pe disc sau suport amovibil și apoi să utilizați metodele standard descrise mai sus.

În loc de un total

După cum puteți vedea, nu este nimic dificil să înțelegeți structura și metodele de deschidere a fișierelor cu acest format. Aici, însă, problema creării datelor XML nu a fost luată în considerare în mod fundamental, deoarece pentru a înțelege pe deplin procesul, trebuie să cunoașteți cel puțin elementele de bază ale limbajului în sine. În caz contrar, cred că utilizatorii nu vor avea dificultăți cu fișierele de acest format.

Limbajul de marcare extensibil (XML). Acestea sunt de fapt doar fișiere text care folosesc etichete personalizate pentru a descrie structura și alte funcții ale documentului.

Ce este XML

XML este un limbaj de marcare creat de World Wide Web Consortium (W3C) pentru a defini o sintaxă pentru codificarea documentelor care pot fi citite de oameni și mașini. Face acest lucru prin etichete, care definesc structura documentului, precum și modul în care documentul ar trebui să fie stocat și transportat.

Cel mai simplu mod de a-l compara cu un alt limbaj de marcare cu care ați putea fi familiarizat este marcare hipertext(HTML) folosit pentru a codifica pagini web. HTML folosește un set predefinit de caractere de marcare (coduri scurte) care descriu formatul conținutului dintr-o pagină web.

Cu toate acestea, diferența cu XML este că este extensibil. XML nu are un limbaj de marcare predefinit precum HTML. În schimb, XML permite utilizatorilor să-și creeze propriile caractere de marcare pentru a descrie conținutul, creând un set nelimitat și autodefinibil de caractere.

În esență, HTML este un limbaj care se concentrează pe prezentarea conținutului, în timp ce XML este un limbaj dedicat pentru descrierea datelor, folosit pentru stocarea datelor.

XML este adesea folosit ca bază pentru alte formate de documente, dintre care există sute. Iată câteva pe care poate doriți să le știți:

  • RSS și ATOM descriu modul în care aplicațiile ar trebui să gestioneze fluxurile web.
  • Microsoft .NET folosește XML pentru fișierele de configurare.
  • Microsoft Office folosește XML ca bază pentru structura documentului.

Deci, dacă aveți un fișier XML, acesta nu vă spune neapărat pentru ce aplicație este. Cu toate acestea, nu trebuie să vă faceți griji cu privire la acest lucru decât dacă dezvoltați fișiere XML.

Cum se deschide un fișier XML

Există mai multe moduri de a deschide direct un fișier XML. Le puteți deschide și edita cu orice editor de text, le puteți vizualiza cu orice browser web sau puteți utiliza un site web care vă permite să le vizualizați, să editați și chiar să le convertiți în alte formate.

Utilizați un editor de text atunci când lucrați cu XML în mod regulat

Deoarece fișierele XML sunt pur și simplu fișiere text, ele pot fi deschise în orice editor de text. Cu toate acestea, multe editoare de text, cum ar fi Notepad, pur și simplu nu sunt concepute pentru a afișa fișiere XML cu structura lor corectă. Acest lucru poate fi util pentru a vă familiariza rapid cu conținutul unui fișier XML. Dar, există instrumente mai convenabile pentru a lucra cu ei.


Utilizarea unui browser web pentru a vizualiza un fișier XML

Dacă nu trebuie să editați fișierul XML, ci doriți doar să vizualizați conținutul, browserul dvs. se poate ocupa de această sarcină. În plus, browserul dvs. web este cel mai probabil deja configurat ca remediu standard vizualizarea fișierelor XML. Deci, dublu clic pe fișierul XML ar trebui să îl deschidă în browser.

Dacă nu, puteți face clic dreapta pe fișier pentru a găsi opțiuni pentru a-l deschide cu orice altă aplicație. Pur și simplu selectați browserul dvs. web din lista de programe.

Când fișierul se deschide, ar trebui să vedeți date bine structurate. Nu este la fel de frumos ca aspectul de culoare pe care îl obțineți în Notepad++, dar este mult mai bun decât notepad.

Utilizarea unui editor online pentru fișiere XML

Dacă doriți să editați un fișier XML aleatoriu și nu doriți să descărcați unul nou editor de text, sau ai nevoie converti fișierul xml într-un alt format Există mai multe editoare XML online decente disponibile gratuit.

TutorialsPoint.com, XMLGrid.net și CodeBeautify.org - Vă permit să vizualizați și să editați fișiere XML. Odată ce editarea este completă, puteți descărca fișierul XML modificat sau chiar îl puteți converti într-un alt format.

De exemplu, folosim CodeBeautify.org. Pagina este împărțită în trei secțiuni. În stânga este fișierul XML cu care lucrați. În mijloc vei găsi mai multe funcții. În dreapta veți vedea rezultatele unora dintre opțiunile din care puteți alege.

De exemplu, în imaginea de mai jos, fișierul nostru XML complet este în stânga, iar panoul de rezultate arată o vizualizare arborescentă, deoarece am făcut clic pe butonul Vizualizare arborescentă din mijloc.

Utilizați butonul Răsfoire pentru a încărca un fișier XML de pe computer sau butonul Încărcare URL pentru a prelua XML dintr-o sursă online

Butonul Tree View afișează datele într-o structură arborescentă bine formatată în panoul de rezultate, cu toate etichetele evidențiate în portocaliu și atributele în partea dreaptă a etichetelor.

Beatify vă afișează datele într-un format ordonat, ușor de citit.

Butonul Reducere vă afișează datele folosind cât mai puține spații posibil. Această funcție va plasa fiecare parte de date pe o singură linie. Acest lucru va fi util atunci când încercați să faceți un fișier mai mic, ceea ce va economisi ceva spațiu.

În cele din urmă, puteți utiliza butonul XML în JSON pentru a converti formatul XML în JSON și butonul Export în CSV pentru a salva datele ca fișier cu valori separate prin virgulă sau butonul Descărcare pentru a descărca orice modificări pe care le-ați făcut noului Fișier XML.

Limbajul XML a atras deja destul de multă atenție din partea dezvoltatorilor și a utilizatorilor de internet. Astăzi, numărul aderenților acestei noi tehnologii crește la fel de rapid ca și numărul de rapoarte despre următoarele obstacole pe care le-a depășit pe calea recunoașterii universale. În ciuda faptului că XML este foarte tânăr (organizația internațională W3C a aprobat specificația „Extensible Markup Language (XML) 1.0” cu puțin mai puțin de un an în urmă - la începutul lunii februarie 1998) și componentele individuale ale acestui limbaj sunt încă în curs de finalizare, noi Astăzi apar deja limbi, create pe baza XML, apar numeroase servere Web care folosesc această tehnologie pentru a organiza informațiile stocate pe ele. Lumea internetului din jurul nostru se transformă din nou, iar astăzi putem deveni participanți la acest proces

Scopul acestui articol este să încerce să arate unele dintre capacitățile XML folosind exemple specifice și să răspundă la o serie de întrebări care apar adesea atunci când cunoaștem o nouă limbă. Ce este XML? Care sunt avantajele sale față de limbajul HTML cu care suntem deja familiarizați? Puteți utiliza XML pe paginile dvs. Web astăzi? Și dacă se poate, atunci cum?

La sfârșitul articolului există link-uri către alte resurse de pe Internet, cu ajutorul cărora puteți obține și informații mai complete despre probleme specifice de interes pentru dvs. legate de utilizarea XML și care nu sunt acoperite de noi în acest articol. Specificațiile complete pentru XML și limbile aferente sunt disponibile pe pagina oficială W3C -

De ce avem nevoie de un nou limbaj de marcare?

Mult mai simplu și mai convenabil decât SGML, limbajul HTML vă permite să determinați designul elementelor documentului și are un anumit set limitat de instrucțiuni - etichete, cu ajutorul cărora se realizează procesul de marcare. Instrucțiunile HTML sunt destinate în primul rând să controleze procesul de afișare a conținutului unui document pe ecranul unui program client și, prin urmare, să determine modul în care este prezentat documentul, dar nu structura acestuia. Elementul unei baze de date hipertext, descris de HTML, este un fișier text care poate fi transmis cu ușurință în rețea folosind protocolul HTTP. Această caracteristică, precum și faptul că HTML este un standard deschis și un număr mare de utilizatori au posibilitatea de a folosi capacitățile acestui limbaj pentru a-și proiecta documentele, au influențat cu siguranță creșterea popularității HTML și l-au făcut astăzi principalul mecanism de prezentare a informaţiei pe Web

Cu toate acestea, aplicațiile moderne necesită nu doar un limbaj pentru prezentarea datelor pe ecranul clientului, ci și un mecanism care vă permite să determinați structura documentului și să descrieți elementele pe care le conține. HTML are un set simplu de comenzi și face față cu succes sarcinii de a descrie informațiile text și de a le afișa pe ecranul unui vizualizator de browser. Cu toate acestea, datele afișate în sine nu au nicio legătură cu etichetele care sunt folosite pentru formatare, așa că programele de analiză nu au capacitatea de a folosi etichete HTML pentru a găsi fragmentele de document de care avem nevoie. Aceste. după ce am întâlnit, de exemplu, o astfel de descriere

trandafir,

privitorul va ști ce culoare să afișeze textul conținut în etichete și probabil îl va afișa corect, dar este absolut indiferent unde în document se găsește această etichetă, în ce alte etichete este închis fragmentul curent, dacă există fragmente imbricate în el sau dacă relațiile dintre obiecte sunt construite corect. Această „indiferență” față de structura unui document duce la faptul că căutarea sau analizarea informațiilor din interiorul acestuia nu va fi diferită de lucrul cu un fișier text continuu care nu este împărțit în elemente. Și acesta, după cum știți, nu este cel mai eficient mod de a lucra cu informații.

Un alt dezavantaj semnificativ al HTML este setul limitat de etichete. Regulile DTD pentru HTML definesc un set fix de descriptori și, prin urmare, dezvoltatorul nu are posibilitatea de a introduce propriile etichete speciale. Deși din când în când apar noi extensii de limbaj (azi cea mai recentă versiune de HTML este HTML 4.0), drumul lung către standardizarea acestora, însoțit de neînțelegeri constante între principalii producători de browsere, face aproape imposibilă adaptarea rapidă a limbajului, a utilizării acestuia. pentru afișarea informațiilor specializate (de exemplu, formule multimedia, matematice, chimice etc.).

Pentru a rezuma tot ceea ce s-a spus, se poate argumenta că HTML astăzi nu satisface pe deplin cerințele pe care dezvoltatorii moderni le pun limbilor. acest gen. Și a fost înlocuit cu un nou limbaj de marcare hipertext, un limbaj XML puternic, flexibil și, în același timp, convenabil. Care sunt avantajele sale?

XML ( Limbajul de marcare extensibil) este un limbaj de marcare care descrie o întreagă clasă de obiecte de date numite documente XML. Acest limbaj este folosit ca mijloc de a descrie gramatica altor limbi și de a controla corectitudinea documentelor. Aceste. XML în sine nu conține nicio etichetă destinată markupurilor, pur și simplu definește ordinea în care sunt create. Astfel, dacă, de exemplu, considerăm că desemnează un element trandafir documentul trebuie să folosească eticheta ;, apoi XML ne permite să folosim liber eticheta pe care o definim și putem include fragmente precum următoarele în document:

trandafir

Setul de etichete poate fi extins cu ușurință. Dacă, să presupunem, vrem să indicăm și că descrierea florii ar trebui să intre în mod semnificativ în descrierea serei în care înflorește, atunci pur și simplu setăm noi etichete și alegem ordinea în care apar:

trandafir

Dacă vrem să mai plantăm câteva flori acolo, trebuie să facem următoarele modificări:

trandafir lalea cactus

După cum puteți vedea, procesul de creare a unui document XML este foarte simplu și ne necesită doar să avem cunoștințe de bază despre HTML și o înțelegere a sarcinilor pe care dorim să le îndeplinim folosind XML ca limbaj de marcare. Acest lucru oferă dezvoltatorilor capacitatea unică de a defini comenzi personalizate care le permit să definească cel mai eficient datele conținute într-un document. Autorul documentului își creează structura, construiește conexiunile necesare între elemente, folosind acele comenzi care îi satisfac cerințele și realizează tipul de marcare de care are nevoie pentru a efectua operațiunile de vizualizare, căutare și analiză a documentului.

Un alt avantaj evident al XML este capacitatea de a-l folosi ca limbaj de interogare universal pentru depozitele de informații. Astăzi, în profunzimea W3C, se ia în considerare o versiune de lucru a standardului XML-QL (sau XQL), care ar putea deveni în viitor un concurent serios pentru SQL. În plus, documentele XML pot acționa ca o modalitate unică de stocare a datelor, care include atât mijloacele de analizare a informațiilor, cât și de prezentare a acestora pe partea clientului. În acest domeniu, una dintre domeniile promițătoare este integrarea tehnologiilor Java și XML, ceea ce face posibilă utilizarea puterii ambelor tehnologii atunci când construiesc aplicații independente de mașină, care utilizează și un format de date universal pentru schimbul de informații.

XML vă permite, de asemenea, să controlați corectitudinea datelor stocate în documente, să verificați relațiile ierarhice din cadrul unui document și să stabiliți un standard unificat pentru structura documentelor, al cărui conținut poate fi o varietate de date. Aceasta înseamnă că poate fi utilizat la construirea unor sisteme informatice complexe, în care problema schimbului de informații între diferite aplicații care rulează în același sistem este foarte importantă. Prin crearea unei structuri pentru un mecanism de schimb de informații chiar la începutul lucrului la un proiect, un manager se poate salva în viitor de multe probleme asociate cu incompatibilitatea formatelor de date utilizate de diferite componente ale sistemului.

De asemenea, unul dintre avantajele XML este că programele de procesare a documentelor XML nu sunt complicate, iar tot felul de produse software concepute să funcționeze cu documente XML au apărut deja și sunt distribuite gratuit. XML este acceptat astăzi în Microsoft Internet Explorer 4/0 și versiunile beta ale IE5. S-a anunțat că va fi acceptat în versiunile ulterioare ale aplicațiilor Netscape Communicator, Oracle DBMS, DB-2 și MS-Office. Toate acestea dau motive de a presupune că, cel mai probabil, în viitorul apropiat, XML va deveni principalul limbaj de schimb de informații pentru sistemele informaționale, înlocuind astfel HTML. Limbaje de marcare specializate bine-cunoscute, cum ar fi SMIL, CDF, MathML, XSL au fost deja create pe baza XML, iar lista proiectelor de lucru ale noilor limbaje luate în considerare de W3C este în continuă creștere.

Cum arată un document XML?

Primul Doilea paragraful 1 Treilea Dura

Reguli pentru crearea unui document XML

RusiaNovosibirsk</country>

Construcții ale limbajului

Elemente de date

trandafir Novosibirsk trandafir Novosibirsk Siberia Universitatea Tehnică de Stat din Novosibirsk
foarte bun institut Universitatea de Stat din Novosibirsk
nici rau

Schema XML este mai puternică decât DTD.

Suport pentru tipurile de date XML Schema

Una dintre cele mai importante este capacitatea tipurilor de date XML Schema de a fi acceptate.

Datorită suportului pentru tipul de date:

  • Poate descrie cu ușurință conținutul valid al documentului
  • Poate fi mai ușor să verificați dacă datele sunt corecte
  • Puteți lucra mai ușor împreună cu datele din baza de date
  • Datele pot fi definite mai ușor prin restricții (fațete de date)
  • Modelul de date (sau formatul de date) poate fi definit cu ușurință
  • Poate fi mai ușor să convertiți datele între diferite tipuri de date

Nota editorului: Constrângerile de date, sau aspectele specificate, este un termen XML - prototip de schemă, chineza poate fi tradusă ca „față”, folosită pentru a limita valoare valabilă tip de date.

Scheme XML folosind sintaxa XML

încă unul caracteristică importantă Schemele XML sunt scrise în XML.

Scrierea XML Schema XML are multe avantaje:

  • Fără a fi nevoie să învețe o nouă limbă
  • Puteți utiliza un editor XML pentru a edita fișierele de schemă
  • Puteți utiliza un parser XML pentru a analiza fișierele de schemă
  • Schema poate fi redată folosind XML DOM
  • Schema poate fi convertită folosind XSLT

XML Schema poate asigura transferul de date

Atunci când datele sunt transferate de la expeditor la destinatar, ideea este că ambele părți trebuie să respecte conținutul acelorași „așteptări”.

Într-o schemă XML, expeditorul și destinatarul pot înțelege modul în care sunt descrise datele.

Date precum „03.11.2004” în unele țări pot fi interpretate ca 3 noiembrie, în timp ce în alte țări este 11 martie.

Cu toate acestea, tipul de date XML al elementului este, de exemplu:<дата типа = "дата"> 2004-03-11 pentru a asigura o înțelegere consecventă a conținutului, deoarece tipul de date XML „date” necesită formatul „AAAA-LL-ZZ”.

Schema XML poate fi extinsă

Schemele XML sunt extensibile deoarece sunt scrise în XML.

Prin definirea schemei extensibile puteți:

  • Reutilizarea schemei dvs. într-o altă schemă
  • Construit cu tipuri standard derivate din propriile tipuri de date
  • Scheme mai multe legături într-un singur document

Forma bună nu este suficientă

Am numit acest document conform cu sintaxa XML a documentelor XML bine formate, cum ar fi:

  • Trebuie să înceapă cu o declarație XML
  • Trebuie să aibă un element rădăcină unic
  • Eticheta de început trebuie să se potrivească cu eticheta de final
  • Elementele sunt sensibile la majuscule
  • Toate elementele trebuie să fie închise
  • Toate elementele trebuie imbricate corect
  • Caracterele speciale trebuie să folosească obiectul

Nici măcar o formă bună de document nu poate garanta că nu vor conține erori, iar aceste erori pot avea consecințe grave.

Luați în considerare următoarea situație: comandați 5 duzini de imprimante laser, în loc de cinci. În Schema XML, cele mai multe dintre aceste erori pot fi prinse în software-ul dumneavoastră de validare.



Publicații pe această temă