Class PdfDataExtractor - lublak/pdfdataextract GitHub Wiki

the extractor for the data of the pdf

Accessors

Methods

Accessors

fingerprint

• get fingerprint(): string

get the fingerprint

Returns

string

the fingerprint

Defined in

pdfdataextractor.ts:166

Methods

close

▸ close(): Promise<void>

close the extractor

Returns

Promise<void>

a promise that is resolved when destruction is completed

Defined in

pdfdataextractor.ts:268

getMetadata

▸ getMetadata(): Promise<null | { info: Info ; metadata: Metadata }>

get the metadata

Returns

Promise<null | { info: Info ; metadata: Metadata }>

| null>} a promise that is resolved with a {{ info: Info; metadata: Metadata; } | null} object with information from the metadata section

Defined in

pdfdataextractor.ts:259

getOutline

▸ getOutline(): Promise<null | Outline[]>

get the outline/bookmarks

Returns

Promise<null | Outline[]>

a promise that is resolved with a {Outline[]} array with information from the tree outline

Defined in

pdfdataextractor.ts:248

getPermissions

▸ getPermissions(): Promise<null | Permissions>

get the permission flags

Returns

Promise<null | Permissions>

a promise that is resolved with a {Permissions | null} object that contains the permission flags for the PDF

Defined in

pdfdataextractor.ts:184

getText

▸ getText(pages?, sort?): Promise<string[]>

get the text

Parameters

Name	Type
`pages?`	`number` \| `number`[] \| (`pageNumber`: `number`) => `boolean`
`sort?`	`boolean`

Returns

Promise<string[]>

a promise that is resolved with a {string[]} array with the extracted text per page

Defined in

pdfdataextractor.ts:207

get

▸ Static get(data, options?): Promise<PdfDataExtractor>

get the extractor for the data

Parameters

Name	Type	Description
`data`	`Uint8Array`	the binary data file
`options`	PdfDataExtractorOptions	-

Returns

Promise<PdfDataExtractor>

a promise that is resolved with a {PdfDataExtractor} object to pull the extracted data from

Defined in

pdfdataextractor.ts:150

Class PdfDataExtractor - lublak/pdfdataextract GitHub Wiki

Table of contents

Accessors

Methods

Accessors

fingerprint

Returns

Defined in

pages

Returns

Defined in

Methods

close

Returns

Defined in

getMetadata

Returns

Defined in

getOutline

Returns

Defined in

getPermissions

Returns

Defined in

getText

Parameters

Returns

Defined in

get

Parameters

Returns

Defined in

⚠️ GitHub.com Fallback ⚠️

Class PdfDataExtractor - lublak/pdfdataextract GitHub Wiki

Table of contents

Accessors

Methods

Accessors

fingerprint

Returns

Defined in

pages

Returns

Defined in

Methods

close

Returns

Defined in

getMetadata

Returns

Defined in

getOutline

Returns

Defined in

getPermissions

Returns

Defined in

getText

Parameters

Returns

Defined in

get

Parameters

Returns

Defined in

⚠️ **GitHub.com Fallback** ⚠️

⚠️ GitHub.com Fallback ⚠️