Sådan læses en DOC-fil ved hjælp af PHP

PHP-programmører søger ofte måder at udvide funktionaliteten på dette sprog uden for dets komfortzone. PHP bruges mest på Linux-operativsystemer, men de besøgende på PHP-websteder arbejder normalt på Windows- eller Macintosh-systemer. Et websted designet til at uploade en Microsoft Word-fil fra disse brugere skal muligvis udpakke indholdet af denne fil og e-maile eller behandle dens tekst ved hjælp af PHP-algoritmer. Men Microsoft Word-filer, der ender i DOC-udvidelsen, er ikke hjemmehørende i Linux eller PHP. Det er muligt at bygge bro mellem disse to computermiljøer med en vis forberedelse.

Trin 1

Bekræft med din værtsudbyder, at PHP-adgang er tilgængelig for dit websted. De fleste servere understøtter PHP, men lejlighedsvis kræver denne service en kontoopgradering. Du kan ikke læse en DOC-fil ved hjælp af PHP uden adgang til compileren.

Trin 2

Download Antiword MS Word-dokumentlæserværktøj (se Referencer). Dette open source-program indeholder programmeringsmateriale, der udvider PHP til DOC-konvertering.

Trin 3

Pak antiwordarkivet ud for at udtrække dets indhold.

Trin 4

Upload hele Antiword-filbiblioteket til webserveren. Placer filerne i "bin" -mappen på værtskontoen. Denne mappe er et almindeligt lager for værktøjer og andre binære operationer, som webserverbrugere ofte skal udnytte.

Trin 5

Ring til Antiword-programmet i ethvert PHP-script designet til at læse et DOC Microsoft Word-dokument. Kommandoen implementeres ved hjælp af en enkelt funktion. Skriv "$ content = shell_exec ('/ usr / local / bin / antiword'. $ Filnavn);" hvor "$ filnavn" svarer til det fulde filnavn på DOC-dokumentet. Indholdet af DOC-filen læses ind i variablen "$ content". Disse variabelnavne, der begynder med "$" -symbolet, kan tilpasses.

Behandl variablen "$ indhold" som ønsket for at manipulere indholdet af DOC-filen. Når DOC er læst af PHP, er den fulde tekst i filen tilgængelig for enhver form for yderligere aktivitet. Indholdet kan f.eks. Mailes eller gemmes i en database.