Global ETD Search

1	Effektivare fakturering med hjälp av XML / More effective invoicehandle with XML Svanström, Karl Johan, Brunius, Niklas January 2001 (has links) Sammanfattning Detta examensarbete utreder hur elektronisk fakturering förhåller sig till traditionell fakturering, samt hur traditionell elektronisk fakturering i form av traditionell Electronic Data Interchange (EDI), kan påverkas av märkspråket XML eller eXtensible Markup Language som det står för. Under utrednings gång har vi stött på vissa motgångar. Motgångarna bestod av att ämnet vi valt att belysa, XML i faktureringssystem, var alldeles för nytt för att genom intervjuer kunna bevisa vår hypotes. XML används helt enkelt inte inom elektronisk fakturering på det sätt vi förutsatt. Vi har därför löst problemet genom att jämföra XML med de traditionella EDI metoderna med hjälp av artikel - och litteratur studier, samt förlitat oss på vad de företag vi intervjuat har gett för svar. I vår bakgrundsinformation har vi beskrivit hur XML fungerar och hur dess bakgrund ser ut. Vi har även beskrivit vilka tillämpningar XML kan användas på, samt beskrivit fakturering, både hur den kan ske manuellt dvs. i pappersform samt hur den elektroniska faktureringen kan fungera. Vi har även tagit med lagar gällande elektronisk fakturering samt kort beskrivning av vad traditionellt utbyte av affärskommunikation i form av traditionell EDI innebär i vår bakgrund. För att kunna få svar på vår frågställning har vi, som vi nämnt ovan, genomfört ett flertal intervjuer av företag, samt använt vetenskaplig litteratur och artiklar. Företagen vi intervjuat har bestått av både företag som tillverkar affärssystem och användare av affärssystem som innefattar faktureringssystem. Utredningen är uppbyggd på företagens svar, som vi sammanställt i resultatform, varpå vi analyserat resultatet. Vi har även i utredningens resultat jämfört skillnader mellan traditionell EDI och XML, och analyserat dem. På samma sätt har vi gjort med de alternativ vi ansett vara relevanta till de benämnda teknologierna. Ett krav för XML: s genomslagskraft är dock att standarder för det elektroniska utbytet av information införs. Detta är dock under utveckling, då det finns starka drivkrafter som till exempel Microsoft som trycker på. XML är en ny teknik som har möjligheter att utgöra grunden för mer flexibla faktureringssystem. XML har möjligheter att erbjuda ett mycket bra alternativ vid elektronisk fakturering då det har stora kostnadsfördelar samt är lättare och går snabbare att implementera än de traditionella EDI lösningarna, som till exempel EDIFACT. Dock krävs som sagt standarder för att XML skall slå igenom. Vi tror dock inte på en universell standard, utan ett flertal anpassade standarder beroende på bransch, företagens storlek samt hur respektive företags branschs ser ut för tillfället. Vi har även dragit slutsatsen att elektronisk fakturering, oavsett metod, är ett bättre alternativ än traditionell fakturahantering där fakturor hanteras manuellt. Detta pga. att stora tids - och kostnads besparingar kan göras. / ABSTRACT This thesis investigates the differences between electronic invoicing and the traditional way of handling invoices. We also investigate in what way the traditional electronic invoicing in the form of EDI can be affected by the eXtensible Markup Language, XML. During this exam, we have encountered some setbacks. The setbacks where that the subject we have decided to illustrate, XML in electronic invoicing systems, is such a new subject. The XML is actually not used in electronical invoicing systems, in the way we?ve expected. We have solved this problem by comparing the XML with the traditional EDI methods, by reading literature and articles together with relying on the answers the interviewed companies has given us. In our background chapter we have described how the XML works, and its background. We have also described what the application of XML is, and illustrated invoicing, both the electronical and the traditional invoicing, in the form of handling invoices manually. We also talk about laws concerning electronic invoicing and also give a short introduction of the traditional exchange of business data with EDI in our background. To be able answer our question at issue, we have as mentioned above, carried out several interviews and read literature and articles. The companies we have interviewed, where both developers and users of business systems that includes invoicing systems. This thesis is founded of what the companies have answered. These answers we have compiled In the way of a result, and then we have analysed those results. We have also in this thesis result chapter, compared the differences between traditional EDI and The XML, and then analysed the result. In the same way we have analysed the result from the alternative solutions to the mentioned technologies. A requirement for the penetration of XML is that standards for the electronic data interchange is introduced. This is however under development, and one reason for this is that big companies like Microsoft is pushing on the development. XML is a new technique that has possibility?s to constitutes a foundation for more flexible solutions in the electronic invoice systems. XML has possibilities to offer a very good alternative in these systems because its great cost advantages and is easier to implement in contrast to the traditional EDI solutions, like EDIFACT. It takes however developed standards, to make the XML successful. We don?t believe in a universal standard, but in standards adjusted for each line of business. We have also drawn the conclusion that electronic based invoicing, no matter witch solution is used, is a better alternative than the traditional invoicing is. This is because great cost and time savings can be done. XML Invoice fakturahanteringssystem faktura elektroniska fakturor Computer Sciences Datavetenskap (datalogi) Business Administration Företagsekonomi
2	Skattebrott bland små företag inom den svenska byggbranschen : Byggbranschens behov av revision / Tax Fraud among Small Companies in the Swedish Construction Industry Glimrén Sjöström, Viktor, Malmberg, Peter January 2019 (has links) Tidigare studier och undersökningar visar en utbredd skattebrottslighet inom byggbranschen. Branschen har framförallt haft problem med brottslighet relaterad till svartjobb. Problemen i fuskbenägna branscher vänta-des öka efter avskaffandet av revisionsplikten för små aktiebolag, då revision har en granskande funktion som både kan avhjälpa och upptäcka fel i redovisning. Idag är det drygt åtta år sedan revisionsplikten avskaffades och det är av stor betydelse att mäta effekten av lagändringen, samt att undersöka behovet av revision i arbetet mot att förebygga skattebrott inom byggbranschen. Studiens syfte är att undersöka och analysera behovet av revision för små bolag inom den svenska byggbranschen, i förebyggandet av skattebrott. Studien siktar på att ge en utökad förståelse om revision motverkar kriminell verksamhet, som leder till uteblivna skatteintäkter och en dysfunktionell konkurrens i branschen. Studien har en kvalitativ ansats med målet att besvara olika frågeställning-ar som berör revision och skattebrott. Det empiriska materialet är inhämtat genom en innehållsanalys av tingsrättsfall som omfattar skattebrotts-domar mellan åren 2011–2017. Data analyserades med besvarande av fem delföreställningar. Studien visar ett behov av revision i förebyggandet av skattebrott inom den svenska byggbranschen. Denna slutsats är grundad på resultaten som visar att; byggbranschen är överrepresenterad i fall om skattebrott, att förekomsten av revision i små byggbolag är mindre än rikssnittet i fallen som skattebrott, att skattebrott till följd av osanna fakturor är mer förekommande inom byggbranschen jämfört med övriga branscher, samt att revision är mer förekommande i fallen med penningmaskering än i övriga fall. Studien visade också det oförväntade resultatet att skattebrotten i små byggbolag inte hade ökat efter avskaffandet av revisionsplikten, vilket kan relateras till teorin om att det finns ett stort mörkertal av skattebrott delvis till följd av utebliven revision. / Previous studies show a widespread of tax crime in the construction industry. The industry has mainly had problems with crimes related to undeclared work. Problems in fraudulent industries are expected to increase after the abolition of the audit obligation for small limited liability companies, as auditing has an examining function that can both remedy and detect errors in the accounting. Today, more than eight years have passed since the statutory audit was abolished and it is of great importance to measure the effect of the amendment, and to investigate the need for audit in the work aiming to prevent tax crimes in the construction industry. The aim of the study is to investigate and analyze small companies' need for audit within the Swedish Construction Industry in the work to prevent tax crimes. The study aims to provide an enhanced understanding of whether auditing counteracts criminal activity in the construction industry, which leads to tax evasion and a dysfunctional competition on the market. The study has a qualitative approach with the aim of answering various questions concerning audit and tax crimes. The empirical material is obtained through a content analysis of district court cases involving tax crime sentences between the years of 2011–2017. Data were analyzed through answering five partial questions. The study shows a need for audit in the work aiming to prevent tax crimes in the Swedish Construction Industry. The conclusion is based on the results that shows; an over-representation of construction companies in cases of tax crimes, that the presence of auditors in small construction companies is less than the national average in cases about tax crimes, that tax crimes as a result of false invoices are more prevalent in the construction industry compared to other industries, and that the auditor is more prevalent in the cases of reverse money laundering than in other cases. The study also showed the unexpected result that the tax crimes did not increase among small construction companies after the abolition of the statutory audit, which can be related to the theory of a large number of un-detected cases of tax crimes partly as a result of inexistent audit. Audit Tax Fraud Construction Industry Revision skattebrott byggbranschen osanna fakturor och penningmaskering Business Administration Företagsekonomi
3	Classification of invoices using a 2D NLP approach : A comparison between methods for invoice information extraction for the purpose of classification / Klassificering av fakturor med 2-dimensionell naturligtspråkbehandling : En jämförelse av metoder för extrahering av nyckelinformation från fakturor i klassificeringssyfte Fredriksson, Linnéa January 2023 (has links) Many companies are handling a large number of invoices every year. To manually categorize them takes a lot of time and resources. For a model to automatically categorize invoices, the documents need to be properly read and processed by the model. While traditional Natural Language Processing may be suitable for processing structured documents, unstructured documents such as invoices often need the layout to be considered in ordered for the document to be read correctly. Techniques that take the visual information in account when processing a document is referred to as 2D NLP. One of such models that is state-of-the-art today is LayoutLMv3. This project provides a comparison of invoice-information extraction using LayoutLMv3 and plain Optical Character Recognition (OCR) for the purpose of invoice classification. LayoutLMv3 were fine-tuned for key-field extraction on 180 annotated invoices. The extracted key-fields were then used to form 3 different configurations of structured text-strings for each document. The structured texts were used for training a classification model into three categories, A: physical product, B: service and C: unknown. The results were compared with a baseline classification model trained on unstructured text obtained through OCR. The results show that all of the models achieved equal performance on the classification task. However, several inconsistencies regarding the annotations of the dataset were found. The project concluded that the raw OCR text proved to be useful for classification despite being unstructured, and that similar classification results could be obtained through considering only a few key-information fields. Obtaining a structured input through LayoutLMv3 proved to be especially useful for controlling the input to the classification model, such as omitting undesirable information. However, the drawbacks might be that some important information in some cases are excluded. / Många företag hanterar en stor mängd fakturor varje år. Att manuellt klassificera dessa in i olika kategorier tar mycket tid och resurser. För en modell som automatiskt ska klassificera fakturor krävs att informationen i dokumenten blir korrekt representerad och hanterad av modellen. Medan naturligtspråkbehandling (NLP) är en lämplig metod för att hantera strukturerade dokument, behöver ostrukturerade dokument ofta hanteras med en metod som även bevarar den visuella informationen på sidan för att dokumentet ska läsas korrekt. Tekniker som gör detta kallas för 2-dimensionell naturligtspråkbehandling. En modell som använder sig av en sådan teknik är LayoutLMv3, som innehar dagens högsta nivå av resultat. Det här projektet utför en jämförelse av metoder för extrahering av information från fakturor med avsikt att användas för klassificering. Extrahering av nyckelinformation med hjälp av LayoutLMv3 jämförs med användning av optisk teckenigenkänning (OCR). LayoutLMv3 finjusterades för nyckelfältsextraktion av 12 informationsfält. Därefter formaterades den extraherade nyckelinformationen från hela datasetet till tre olika strukturerade text-inmatningar. De strukturerade texterna användes sedan för att träna en klassificeringsmodell på tre kategorier, A: fysisk produkt, B: tjänst, och C: okänt. Resultaten jämfördes med en basmodell tränad på den ostrukturerade texten från OCR. Resultaten visar att alla modellerna presterar lika bra. Emellertid påträffades några olyckliga inkonsekvenser i den utförda annoteringen av fakturorna. Projektets slutsats är att den råa OCR texten visar sig vara användbar för klassificeringen trots att det är en ostrukturerad representation av dokumenten, men att liknande resultat kan fås vid användning av bara ett fåtal nyckelfält. Användning av den strukturerade texten från LayoutLMv3 visade sig vara särskilt behändig för att kontrollera inmatningen till klassificeringsmodellen, såsom att exkludera viss information. Däremot kan det vara en nackdel att viss information i somliga fall blir förbisedd. Key-field extraction Invoices 2D NLP Document Intelligence Visually Rich Documents LayoutLMv3 Nyckelfältsextraktion Fakturor 2-dimensionell naturligtspråkbehandling LayoutLMv3 Computer and Information Sciences Data- och informationsvetenskap
4	Maskininlärning för dokumentklassificering av finansielladokument med fokus på fakturor / Machine Learning for Document Classification of FinancialDocuments with Focus on Invoices Khalid Saeed, Nawar January 2022 (has links) Automatiserad dokumentklassificering är en process eller metod som syftar till att bearbeta ochhantera dokument i digitala former. Många företag strävar efter en textklassificeringsmetodiksom kan lösa olika problem. Ett av dessa problem är att klassificera och organisera ett stort antaldokument baserat på en uppsättning av fördefinierade kategorier.Detta examensarbete syftar till att hjälpa Medius, vilket är ett företag som arbetar med fakturaarbetsflöde, att klassificera dokumenten som behandlas i deras fakturaarbetsflöde till fakturoroch icke-fakturor. Detta har åstadkommits genom att implementera och utvärdera olika klassificeringsmetoder för maskininlärning med avseende på deras noggrannhet och effektivitet för attklassificera finansiella dokument, där endast fakturor är av intresse.I denna avhandling har två dokumentrepresentationsmetoder "Term Frequency Inverse DocumentFrequency (TF-IDF) och Doc2Vec" använts för att representera dokumenten som vektorer. Representationen syftar till att minska komplexiteten i dokumenten och göra de lättare att hantera.Dessutom har tre klassificeringsmetoder använts för att automatisera dokumentklassificeringsprocessen för fakturor. Dessa metoder var Logistic Regression, Multinomial Naïve Bayes och SupportVector Machine.Resultaten från denna avhandling visade att alla klassificeringsmetoder som använde TF-IDF, föratt representera dokumenten som vektorer, gav goda resultat i from av prestanda och noggranhet.Noggrannheten för alla tre klassificeringsmetoderna var över 90%, vilket var kravet för att dennastudie skulle anses vara lyckad. Dessutom verkade Logistic Regression att ha det lättare att klassificera dokumenten jämfört med andra metoder. Ett test på riktiga data "dokument" som flödarin i Medius fakturaarbetsflöde visade att Logistic Regression lyckades att korrekt klassificeranästan 96% av dokumenten.Avslutningsvis, fastställdes Logistic Regression tillsammans med TF-IDF som de övergripandeoch mest lämpliga metoderna att klara av problmet om dokumentklassficering. Dessvärre, kundeDoc2Vec inte ge ett bra resultat p.g.a. datamängden inte var anpassad och tillräcklig för attmetoden skulle fungera bra. / Automated document classification is an essential technique that aims to process and managedocuments in digital forms. Many companies strive for a text classification methodology thatcan solve a plethora of problems. One of these problems is classifying and organizing a massiveamount of documents based on a set of predefined categories.This thesis aims to help Medius, a company that works with invoice workflow, to classify theirdocuments into invoices and non-invoices. This has been accomplished by implementing andevaluating various machine learning classification methods in terms of their accuracy and efficiencyfor the task of financial document classification, where only invoices are of interest. Furthermore,the necessary pre-processing steps for achieving good performance are considered when evaluatingthe mentioned classification methods.In this study, two document representation methods "Term Frequency Inverse Document Frequency (TF-IDF) and Doc2Vec" were used to represent the documents as fixed-length vectors.The representation aims to reduce the complexity of the documents and make them easier tohandle. In addition, three classification methods have been used to automate the document classification process for invoices. These methods were Logistic Regression, Multinomial Naïve Bayesand Support Vector Machine.The results from this thesis indicate that all classification methods used TF-IDF, to represent thedocuments as vectors, give high performance and accuracy. The accuracy of all three classificationmethods is over 90%, which is the prerequisite for the success of this study. Moreover, LogisticRegression appears to cope with this task very easily, since it classifies the documents moreefficiently compared to the other methods. A test of real data flowing into Medius’ invoiceworkflow shows that Logistic Regression is able to correctly classify up to 96% of the data.In conclusion, the Logistic Regression together with TF-IDF is determined to be the overall mostappropriate method out of the other tested methods. In addition, Doc2Vec suffers to providea good result because the data set is not customized and sufficient for the method to workwell. Document classification Text classification Invoices NLP TF-IDF Doc2vec Machine Learning Logistic Regression Multinomial Naïve Bayes Support Vector Machine. Dokumentklassificering Textklassificering Fakturor NLP TF-IDF Doc2vec Maskininlärning Logistic Regression Multinomial Naïve Bayes Support Vector Machine. Computer Sciences Datavetenskap (datalogi)

1

Page generated in 0.1017 seconds