Forum PHP.pl > Zarządzanie treścią

Pomoc - Szukaj - Użytkownicy - Kalendarz

Forum PHP.pl > Forum > PHP > Pro > Archiwum Pro

matid

22.04.2005, 18:53:25

Zastanawiam się, jak rozwiązać w CMSie zarządzenie treścią. Na chwilę obecną mam mniej więcej coś takiego.

Tabela Content, zawierająca pola
id [ int(11) ]
xml [ text ]

Oprócz tego jest kilka dodatkowych pól umożliwiających tworzenie drzewa itp, ale na razie jest to nie ważne.

I teraz przykładowa treść xml dla folderu wygląda tak:

[XML] pobierz, plaintext 
<?xml version="1.0"?>
<document type="folder">
<title>Folder główny</title>
<description>W tym folderze znajdują się wszystkie podelementy systemu.</description>
</document>
[XML] pobierz, plaintext

Dla artykułu tak:

[XML] pobierz, plaintext 
<?xml version="1.0"?>
<document type="article">
<author>Mateusz 'matid' Drożdżyński</author>
<timestamp>1113296158</timestamp>
<title>Nowy lider projektu Debian</title>
<description>Swoją kadencję jako lider projektu kończy właśnie Martin Michlmayr, a jego miejsce 17 kwietnia zajmie Branden Robinson wybrany w zakończonym wczoraj głosowaniu. Słów kilka o głosowaniu oraz nowowybranym liderze...</description>
<content>Procedura głosowania w projekcie Debian różni się dość znacznie od tego do czego przyzwyczajeni jesteśmy choćby w wyborach prezydenckich. Głosy można oddawać na każdego kandydata podając dodatkowo wagę głosu. Tym sposobem każdy oprócz faworyzowania swojego kandydata nr 1, ma również wpływ na miejsca zajmowane przez resztę. Nic nie stoi na przeszkodzie by każdemu kandydatowi przyznać głos o największej wadze, ale nie będę się tutaj rozpisywał nad sensownością takiego postępowania ;)
 
Jak już wspomniałem wybory wygrał Branden Robinson, którego sylwetkę chciałbym w skrócie opisać. Branden jest deweloperem Debiana od roku 1998. Dotychczas głównie zajmował się opieką nad pakietami XFree86, a od 2001 roku zasiada w zarządzie Software in the Public Interest, Inc. Od 5 lat pracuje w firmie Progeny. W wyborach na lidera projektu startował nieprzerwanie od 2001 roku, jednak dopiero w tym roku odniósł sukces.
O zamiarach Brandena jako lidera projektu można przeczytać w jego programie wyborczym. Dostępne jest również szczegółowe sprawozdanie z wyborów. Pozostaje tylko życzyć nowemu liderowi sukcesów i doczekania się nowego stabilnego wydania za jego kadencji ;)</content>
</document>
[XML] pobierz, plaintext

A teraz pytania.

1. Czy to będzie wydajne? IMO średnio. Każde przeglądanie wymaga parsowania pliku XML, nie mówiąc już o wyświetleniu drzewa z tytułami (potrzeba pobrać wszystkie dzieci, wszystkim przeparsować XML i wyświetlić). Z wyszukiwaniem też będzie problem. Tak samo jak z wyświetlaniem np. wszystkich artykułów z danego folderu.
Dobrym rozwiązaniem wydaje się dopisanie do tego dobrego systemu cache i jakiejś wyszukiwarki z crowlerem zapisującym słowa kluczowe. Jeśli ktoś ma jakiś pomysł na dobre wyszukiwanie i cache to proszę się podzielić

2. Jak rozwiązać wyświatlanie. Na chwilę obecną jest to obsługiwane przez zwykły parser XML, który zamienia mi ten dokument na tablicę, która najstępnie jest przekazywana do renderera (np. Smarty, itp.)
Zastanawiałem się także nad XSLT, ale nie bardzo wiem jak w PHP4 się do tego zabrać.
Teraz jest jeszcze kolejny problem, czyli templaty lokalne. Co jeśli chcę wyświetlać w jednym folderze artykuły w inny sposób niż w drugim? Obecnie rozwiązuje to za pomocą sekcji. Tworzę sobie powiedzmy sekcję na folderze głównym, skrypt przy wyświetlaniu elementu sprawdza najbadziej szczegółową (czyli jak mam Root->News->News_1 to najpierw sprawdza News, potem Root) w poszukiwaniu odpowiedniego szablonu. Wydaje się to dość dobrym rozwiązaniem, co o tym sądzicie?

Z góry dzięki za pomoc.

mike

22.04.2005, 21:36:42

IMO XML jest dobry do przenoszenia danych, przesyłania miedzy aplikacjami i tego typu rzeczy. Natomiast trzymanie w nim danych jak w bazie to zupełna pomyłka.
Na Twoim miejscu trzymałbym treści w bazie lub same adresy o plików, w których są treścia dodatkowo w bazie reszte informacji.
IMO XML do tego co robisz kompletnie sie nie nadaje.

matid

22.04.2005, 21:57:12

Cytat(mike_mech @ 2005-04-22 22:36:42)

Moim zdaniem jest to dobre wyjście chociażby z tego względu, że przy wprowadzaniu danych nie jesteśmy ograniczeni strukturą bazy danych. AFAIK w wielu systemach jest to implementowane w ten sposób.

sobstel

22.04.2005, 22:59:01

moim zdaniem także nie takie jest przeznaczenie XMLu. np. spróbuj mi teraz wyszukac wszystkei artykulu danej osoby, albo zrobic jakakolwiek wyszukiwarke. bedziesz przeszukiwal wszystkei pliki xml? optymalizacyjna klapa.

mike

22.04.2005, 23:41:34

XML do konfiguracji systemu, owszem.
Ale do trzymania treści, ble.
Zgadzam się z poprzednikiem, a co z wyszukiwaniem, i pożądkowaniem danych.
Ich układem i przejrzystością.

A jeżeli mówisz że ogranicza cie struktura tabeli to robisz dwie: treści i arty. A nie wszystko w jednym pliku.

No i już nie wspomną o tym że takie pliki będe parsowane za każdym odświerzeniem strony, a to zajmuje duuuuużo czasu.

Powtażam pomysł chybiony.

matid

23.04.2005, 08:13:03

Cytat(sopel @ 2005-04-22 23:59:01)

[SQL] pobierz, plaintext 
SELECT id, xml 
FROM content WHERE xml LIKE "%<author>Mateusz 'matid' Drożdżyński</author>%";
[SQL] pobierz, plaintext

A w ten sposób? Dalej podtrzymuje, że moim zdaniem jest to dobre rozwiązanie.

W tym temacie też polecają trzymanie danych w XMLu.

sobstel

23.04.2005, 08:30:01

Cytat(matid @ 2005-04-23 08:13:03)

[SQL] pobierz, plaintext 
SELECT id, xml 
FROM content WHERE xml LIKE "%<author>Mateusz 'matid' Drożdżyński</author>%";
[SQL] pobierz, plaintext

A w ten sposób? Dalej podtrzymuje, że moim zdaniem jest to dobre rozwiązanie.

trudno nazwać to wydajnym rozwiązaniem, zwłaszcza gdy przyjdzie ci wyciągać dane wg. bardziej złożonych kryteriów (co sam zresztą zauważyłeś w swoim poście). tak czy owak nikt tu raczej na siłę nie będzie Cię przekonywał. chciałeś opini i my tu swoją wyraziliśmy. dla mnie to się mija z celem.

matid

23.04.2005, 08:32:31

Cytat(sopel @ 2005-04-23 09:30:01)

Cytat(matid @ 2005-04-23 08:13:03)

[SQL] pobierz, plaintext 
SELECT id, xml 
 
FROM content WHERE xml LIKE "%<author>Mateusz 'matid' Drożdżyński</author>%";
[SQL] pobierz, plaintext

A w ten sposób? Dalej podtrzymuje, że moim zdaniem jest to dobre rozwiązanie.

No to jakie inne rozwiązanie proponujesz? Nie chcę być ograniczony strukturą bazy danych, bo jak ktoś będzie chciał dodać sobie jakieś dodatkowe pole np. do artykułu to nie powinien mieć z tym żadnych problemów. Oprócz tego najlepiej, jakby wszystko mogło leżeć w jednej tabeli.

hawk

23.04.2005, 09:32:45

Odróżnij treść artykułu od atrybutów artykułu. Autor to nie jest treść, tylko atrybut. Trzymanie atrybutów w XML tylko utrudnia wyszukiwanie. Trzymanie treści w bazie danych zapycha bazę.

mike

23.04.2005, 09:41:26

Cytat(hawk @ 2005-04-23 09:32:45)

Odróżnij treść artykułu od atrybutów artykułu. Autor to nie jest treść, tylko atrybut. Trzymanie atrybutów w XML tylko utrudnia wyszukiwanie. Trzymanie treści w bazie danych zapycha bazę.

Wniosek ( IMO ):
- atrybuty w bazie: łatwośc wyszukiwania, "lekka" baza;
- treści w plikach ( adresy do nich w bazie ).

A i jeszcze powiedz dlaczego chcesz wszystko trzymać w jednej tabeli?
Ja wtedyodróżnisz np. news'a od artykułu? Dodatkowy atrybut.

No i czas dostępu do danych jest bardzo ważny. A parsując pliki XML czasu tego nie znajdziesz.

To by było na tyle w tym temacie z mojej strony.

aleksander

23.04.2005, 10:00:44

mike_mech - CMS nie rozróżnia artykułu od newsa. Dla niego wszystko jest treścią, tylko mogą być różne sposoby jej prezentacji (np rózne szablony smarty czy xslt).

W porządnych CMSach masz też system keszowania więc czas uzyskiwania dostępu do danych się zmniejsza :]

matid

4.05.2005, 20:47:32

Cytat(hawk @ 2005-04-23 10:32:45)

Odróżnij treść artykułu od atrybutów artykułu. Autor to nie jest treść, tylko atrybut. Trzymanie atrybutów w XML tylko utrudnia wyszukiwanie. Trzymanie treści w bazie danych zapycha bazę.

Teraz planuję zrobić coś takiego.
Mam dokument XML (oczywiście z deklaracją DTD zgodną z moim systemem i jego DTD będzie w mojej bazie danych).
Importuję go do systemu. Parser zbiera sobie informacje o pliku, czyli rodzaj dokumentu (DTD), autora(-ów), datę utworzenia, modyfikacji, itp. Zapisuje to w bazie danych w odpowiedniej tabeli wraz z informacją na temat położenia pliku XML. Użytkownik, jeśli będzie chciał wyświetlić powiedzmy wszystkie pliki danego autora, szuka to w bazie. Baza zwraca nazwy plików XML.
Jeśli istnieje cache w postaci XHTML to jest ładowany, jeśli nie to za pomocą XSLT plik XML jest transformowany do XHTMLa i cachowany.
Użytkownik ma ładne wyświetlanie, ja mam dane w postaci XML, szukanie jest szybkie. Cache optymalny. Co myślicie o takim rozwiązaniu?
I teraz tylko rodzi się pytanie - jak rozwiązać przeszukiwanie treści artykułów...

hawk

5.05.2005, 19:44:26

A skąd parser weźmie autora itd? Z sufitu?

matid

5.05.2005, 21:00:18

Cytat(hawk @ 2005-05-05 20:44:26)

A skąd parser weźmie autora itd? Z sufitu?

Nie z sufitu, tylko dokument XML będzie miał np. taką postać:

[XML] pobierz, plaintext 
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xml" href="article.xsl"?>
<!DOCTYPE article SYSTEM "article.dtd">
<article>
    <title>Mój artykuł</title>
    <date>22.04.2005 18:30</date>
    <author>Mateusz 'matid' Drożdżyński</author>
    <content>
        <intro>Lorem dolor sit amet, consectetuer adipiscing elit. Donec non purus vel metus pretium consequat. Aliquam arcu. Cras elementum sagittis nulla. Integer ac erat. Phasellus elementum, mauris quis adipiscing sollicitudin, arcu ligula tempor libero, ut convallis purus wisi sed wisi. Integer sed massa. Cras eu sapien non tortor pellentesque facilisis. Suspendisse potenti. Nunc nulla quam, accumsan eu, consequat eu, adipiscing vel, lorem. Integer molestie erat ut erat. Curabitur consequat. Aliquam ullamcorper pulvinar lectus. Donec ac lorem ut purus dictum venenatis.</intro>
 
        <chapter>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Donec non purus vel metus pretium consequat. Aliquam arcu. Cras elementum sagittis nulla. Integer ac erat. Phasellus elementum, mauris quis adipiscing sollicitudin, arcu ligula tempor libero, ut convallis purus wisi sed wisi. Integer sed massa. Cras eu sapien non tortor pellentesque facilisis. Suspendisse potenti. Nunc nulla quam, accumsan eu, consequat eu, adipiscing vel, lorem. Integer molestie erat ut erat. Curabitur consequat. Aliquam ullamcorper pulvinar lectus. Donec ac lorem ut purus dictum venenatis. Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Donec non purus vel metus pretium consequat. Aliquam arcu. Cras elementum sagittis nulla. Integer ac erat. Phasellus elementum, mauris quis adipiscing sollicitudin, arcu ligula tempor libero, ut convallis purus wisi sed wisi. Integer sed massa. Cras eu sapien non tortor pellentesque facilisis. Suspendisse potenti. Nunc nulla quam, accumsan eu, consequat eu, adipiscing vel, lorem. Integer molestie erat ut erat. Curabitur consequat. Aliquam ullamcorper pulvinar lectus. Donec ac lorem ut purus dictum venenatis.</chapter>
    </content>
</article>
[XML] pobierz, plaintext

hawk

8.05.2005, 08:17:10

A jeżeli autor artykułu nie chce pisać wg tego DTD? To nie jest z niczym zgodne. Żaden edytor tego nie wspiera. Nikt tego nie zna. Język jest potwornie ubogi. Nie ma sposobu na wyróżnienie tekstu. Nie ma listingów. Wypunktowania. Tabelek. Obrazków. Odnośników. Niczego nie ma. Możesz albo zostawić taki format, pozbawiając się większości funkcjonalności, albo rozszerzyć go, pakując się w straszne bagno.

Tworzenie własnego formatu artykułów jest gigantyczną pracą, więc nie warto opierać na tym systemu. Jeżeli już, wyciągaj te informacje z DocBooka. A jeżeli już mówimy o CMS, to co będzie, jak ktoś będzie chciał umieścić coś innego niż taki artykuł?

chmolu

8.05.2005, 08:46:06

Jeżeli dokument będzie przekształcany za pomocą XSLT, to warto poszukać edytora WYSIWYG, który polega na tym, że dokument jest transformowany w czasie pisania. Wystarczy wtedy stworzyć szablon XSLT i mamy obsługę dowolnego formatu w edytorze. Nie wiem, czy dobrze pamiętam, ale zdaje mi się, że TUTAJ powinien być taki edytor.

matid

8.05.2005, 09:45:23

Cytat(hawk @ 2005-05-08 09:17:10)

Planowałem rozszerzyć ten DTD o różne inne możliwości w stylu obrazków, podkreśleń, itd.
BTW - chciałem też dać możliwość uploadowania własnego DTD i XSLT.

A co do DocBook to muszę się zastanowić.

Aha, tak pozatym to nie jest tak, że system będzie przyjmował tylko i wyłącznie pliki XML. Na chwilę obecną mam w planach napisanie edytora, kŧóry na podstawie DTD będzie edytował formularz.
Czyli ktoś wybiera, że chce stworzyć artykuł, to na podstawie DTD artykułu dostanie do tego ładny formularz.

hawk

8.05.2005, 22:53:14

Jeżeli użytkownik może uploadować swoje własne DTD, to ja chcę zrobić takie, w którym autor artykułu przechowywany jest w tagu <czas>, a data utworzenia w tagu <autor>. Moje DTD, wolno mi. Zrób mi do tego parser.

A jeżeli na podstawie DTD będziesz robił formularz, to musisz napisać paser DTD. Co też nie jest proste. I co niby ten parser zrobi z DTD? Jak mu zapodam DTD do HTMLa, to ciekawe, co on mi wyprodukuje...

bigZbig

10.05.2005, 07:59:03

@matid -> moim skromnym zdaniem zwyczajnie utrudniasz sobie robote. Na temat sensu uzywania xml w php wypowiedzialem sie juz w temacie [porada]tpl Vs. php. Sam tez juz odwiedzales ten temat ale moze nie jestes na biezaco ;-)

Jesli juz koniecznie zalezy Ci na zastosowaniu technologi xslt to zapoznaj sie z ponizszym przykladem:

[XML] pobierz, plaintext 
<?xml version="1.0" encoding="ISO-8859-2"?>
<channel>
   <item type="klamstwo">
      <title>Microsoft końy rozwój Windows</title>
      <url>http://www.nothere.com/foo/bar</url>
   </item>
 
   <item type="klamstwo">
      <title>George W. Bush znajduje Irak na mapie</title>
      <url>http://www.jakisserwis.irq/news/4544.html</url>
   </item>
 
   <item type="klamstwo">
      <title>Grzegorz M. sprzedaje lodówki eskimosom</title>
      <url>http://www.eskimostuff.nrd/ble/wombat.php</url>
   </item>
</channel>
[XML] pobierz, plaintext

[XML] pobierz, plaintext 
<?xml version="1.0" encoding="utf-8" ?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://my.netscape.com/rdf/simple/0.9/">
 
<xsl:output method="html" indent="no" encoding="utf-8"/>
 
<xsl:template match="/">
<html>
<head>
<title>XSLT</title>
</head>
<body>
 
   <xsl:for-each select="/channel/item">
      Pojedynczy News: <xsl:value-of select="title"/><br />
   </xsl:for-each>
 
</body>
</html>
</xsl:template>
</xsl:stylesheet>
[XML] pobierz, plaintext

[PHP] pobierz, plaintext 
<?php
 
if (PHP_VERSION >= 5) {
   // Emulate the old xslt library functions
   function xslt_create() {
	   return new XsltProcessor();
   }
 
   function xslt_process($xsltproc,
						 $xml_arg,
						 $xsl_arg,
						 $xslcontainer = null,
						 $args = null,
						 $params = null) {
	   // Start with preparing the arguments
	   $xml_arg = str_replace('arg:', '', $xml_arg);
	   $xsl_arg = str_replace('arg:', '', $xsl_arg);
 
	   // Create instances of the DomDocument class
	   $xml = new DomDocument;
	   $xsl = new DomDocument;
 
	   // Load the xml document and the xsl template
	   $xml->loadXML($args[$xml_arg]);
	   $xsl->loadXML($args[$xsl_arg]);
 
	   // Load the xsl template
	   $xsltproc->importStyleSheet($xsl);
 
	   // Set parameters when defined
	   if ($params) {
		   foreach ($params as $param => $value) {
			   $xsltproc->setParameter(&#092;"\", $param, $value);
		   }
	   }
 
	   // Start the transformation
	   $processed = $xsltproc->transformToXML($xml);
 
	   // Put the result in a file when specified
	   if ($xslcontainer) {
		   return @file_put_contents($xslcontainer, $processed);
	   } else {
		   return $processed;
	   }
 
   }
 
   function xslt_free($xsltproc) {
	   unset($xsltproc);
   }
}
 
$file_xml = 'chanel.xml';
$file_xsl = 'chanel.xsl';
 
$arguments = array(
   '/_xml' => file_get_contents($file_xml),
   '/_xsl' => file_get_contents($file_xsl)
);
 
$xsltproc = xslt_create();
$html = (PHP_VERSION >= 5) ? xslt_process($xsltproc,'arg:/_xml','arg:/_xsl',null,$arguments) : xslt_process($xsltproc, './'.$file_xml, './'.$file_xsl);
 
xslt_free($xsltproc);
print $html;
 
?>
[PHP] pobierz, plaintext

Jeszcze jedna uwaga. Zamiast DTD uzyj xsd - jest precyzyjniejszy.

matid

10.05.2005, 11:50:23

Dzięki za rady. Zastanowię się jeszcze czy użyć XMLa w moich projektach. Zresztą spróbuję napisać coś więcej i sprawdzić wydajność.

A co do kodu - przecież tutaj mam własny kod dobrze działąjący i nie widzę większej różnicy co do twojej wersji.

Seth

10.05.2005, 12:55:58

Tez ostatnio sie nad tym zastanawialem i doszedlem do takiego wniosku:
http://www.binarychoice.pl/item/28/

Dolaczylem tam schemat struktury bazy danych, ktory chyba najlepiej zobrazuje przechowywanie danych.

Ace

10.05.2005, 16:00:43

Seth: fajnie to zobrazowales, w sumie w chwili obecnej moja struktura cms'a wyglada statycznie, bo w sumie musze definiowac nowe typy obiektow poprzez kopiowanie plikow i tworzenie samemu kodu...

ale daze do tego zeby mozna bylo sobie wyklikac wlasny obiekt z roznymi mozliwosciami np: title, description, photo1, photo2, file, co tylko mozna sobie zarzyczyc...

ShaXbee

15.05.2005, 10:41:15

Ja widzę rozwiązanie podobne do tego co zaproponował @hawk, czyli w bazie trzymamy id, autora, tytuł, słowa kluczowe, natomiast w pliku .xml miałbyś samą treść newsa. Aby zwiększyć szybkość działania możesz zastosować prosty Trick - XMLa parsujesz, następnie serializujesz jako tablice i zapisujesz do pliku - bardzo szybkie, często szybsze od bazy danych. Odświeżenie zawartośći zserializowanego pliku dokonujesz jesli sie zmieni rozmiar / data pliku. Dodatkowo mozna zastosowac jeszcze jeden trick - kopie zserializowanych plików, które są pobierane najczęściej umieszczasz na ramdysku (tempfs czy siakoś tak) - ale to raczej w Windzie, Unix'y robią to automatycznie.

To jest wersja lo-fi głównej zawartości. Aby zobaczyć pełną wersję z większą zawartością, obrazkami i formatowaniem proszę kliknij tutaj.