See Changelog: Updates to Indexed Search (mainly), t3lib_cs (bug), t3lib_tcemain...
[Packages/TYPO3.CMS.git] / typo3 / sysext / indexed_search / ext_conf_template.txt
1   # cat=basic; type=string; label=Path to PDF parsers: The indexer uses the applications 'pdftotext' and 'pdfinfo' for extracting content from PDF files. You must install these applications in this path. Otherwise leave the field empty.
2 pdftools = /usr/local/bin/
3
4   # cat=basic; type=int; label=PDF parsing mode: Zero=whole file is indexed in one. Positive value: Indicates number of pages at a time, eg. "5" would mean 1-5,6-10,.... Negative integer would indicate (abs value) number of groups. Eg "3" groups of 10 pages would be 1-4,5-8,9-10. Range is -100 to 100.
5 pdf_mode = 20
6
7   # cat=basic; type=boolean; label = Native OpenOffice support: Use the extension "libunzipped" to extract Open Office files instead of the external program "ruby" / "ooo_extract.rb"
8 nativeOOMethod = 0
9
10   # cat=basic; type=string; label=Path to OOo parser: The indexer uses the application 'ooo_extract' for extracting content from OpenOffice files (unless "[nativeOOMethod]" above is set). You must install ooo_extract in this path. Otherwise leave the field empty.
11 OOoExtract = /usr/local/bin/
12
13   # cat=basic; type=string; label=Path to RUBY: The indexer uses the application 'ruby' for extracting content from OpenOffice files (unless "[nativeOOMethod]" above is set). You must install this application in this path. Otherwise leave the field empty.
14 ruby = /usr/local/bin/
15
16   # cat=basic; type=string; label=Path to WORD parser: The indexer uses the application 'catdoc' for extracting content from WORD files. You must install this application in this path. Otherwise leave the field empty.
17 catdoc = /usr/local/bin/
18
19   # cat=basic; type=string; label=Path to EXCEL parser: The indexer uses the application 'xlhtml' for extracting content from EXCEL files. You must install this application in this path. Otherwise leave the field empty.
20 xlhtml = /usr/local/bin/
21
22   # cat=basic; type=string; label=Path to POWERPOINT parser: The indexer uses the application 'ppthtml' for extracting content from POWERPOINT files. You must install this application in this path. Otherwise leave the field empty.
23 ppthtml = /usr/local/bin/
24
25   # cat=basic; type=string; label=Path to RTF parser: The indexer uses the application 'unrtf' for extracting content from RTF files. You must install this application in this path. Otherwise leave the field empty.
26 unrtf = /usr/local/bin/
27
28    # cat=basic; type=boolean; label=Debug mode: If set, debugging information is collected during indexing and can be shown in the backend. Only for debugging since it slows down the system and fills the database with crap.
29 debugMode = 0
30
31   # cat=basic; type=boolean; label=Disable Indexing in Frontend: By default pages are indexed during viewing of pages in the frontend. You can disable this features so indexing of pages is only initiated through the backend page crawler.
32 disableFrontendIndexing = 0
33
34   # cat=basic; type=int; label=Min TTL (hours) for indexed page: The time in hours that must pass before an indexed page can be indexed again regardless of changes on the page.
35 minAge = 24
36
37   # cat=basic; type=int; label=Max TTL (hours) for indexed page: The time in hours that is the maximum age of an indexed page before it will get indexed again.
38 maxAge = 168
39
40   # cat=basic; type=int; label=Max external files to index: When external files are found on a page this number indicates how many may be indexed at that point. This prevents pages with links to many external documents to take the server down - but it may also prevent documents from being indexed.
41 maxExternalFiles = 5
42
43   # cat=basic; type=int; label=Bitmask for Flags (Advanced): By this value (0-255) you can filter the importance of <title> (128), <keywords> (64) and <description> (32) content from HTML documents. By default none of these will have any importance over the other. Setting the value to eg. 196 means that title-tag content and meta-keywords will be flagged (and rate higher in search results)
44 flagBitMask = 196
45
46   # cat=basic; type=string; label=Ignore Extensions: List of file extensions that the external parser will ignore (despite having support for them). Comma list.
47 ignoreExtensions =
48
49   # cat=basic; type=boolean; label=Index External HTML URLs: If set, links to external URLs will be indexed if they are of type "text/html".
50 indexExternalURLs = 0