Evolution of AI in solving accounting problems: A comparison between GPT4 and GPT4o in solving the Accounting Proficiency Exam

Authors

  • Marcelo Machado de Freitas Universidade Federal de Santa Catarina - UFSC https://orcid.org/0000-0001-9767-7285

    Doutor em Contabilidade pela Universidade Federal de Santa Catarina - UFSC. Mestrado em Contabilidade e graduado em Ciências Contábeis pela Universidade Federal de Santa Catarina, UFSC. Professor do Departamento de Ciências Contábeis da Universidade Federal de Santa Catarina, UFSC.

  • Jonatas Dutra Sallaberry Universidade do Contestado - UNC https://orcid.org/0000-0001-7492-727X

    Doutor em Contabilidade pela Universidade Federal de Santa Catarina - UFSC. Mestrado em Contabilidade pela Universidade de Brasília - UNB. Graduado em Ciências Contábeis pela Universidade Federal do Rio Grande do Sul - UFRGS. Professor da Universidade Federal do Paraná - UFPR.

  • Thiago Bruno de Jesus Silva Universidade Federal do Recôncavo da Bahia - UFRB https://orcid.org/0000-0002-1128-6601

    Doutor em Contabilidade pela Universidade Federal de Santa Catarina - UFSC. Mestrado em Contabilidade pela Fundação Universidade Regional de Blumenau - FURB. Graduado em Ciências Contábeis pela Universidade do Estado da Bahia - UEBA. Professor do curso de Gestão de Cooperativas da Universidade Federal do Recôncavo da Bahia - UFRB.

  • Fabricia Silva da Rosa Universidade Federal de Santa Catarina - UFSC https://orcid.org/0000-0003-4212-1065

    Doutora em Engenharia de Produção pela Universidade Federal de Santa Catarina - UFSC, e Doutora em Contabilidade pela Universitat de València - UV. Mestrado em Engenharia da Produção pela Universidade Federal de Santa Catarina, UFSC. Graduado em Ciências Contábeis pela Universidade Federal de Santa Catarina, UFSC. Professora do Departamento de Contabilidade da Universidade Federal de Santa Catarina, UFSC.

DOI:

https://doi.org/10.18800/contabilidad.2025ESP.005

Keywords:

Use of technologies, ChatGPT4o, Large language models (LLMs)

Abstract

The research aimed to evaluate the performance of the GPT-4o model compared to the GPT-4 model in solving questions on the Accounting Proficiency Exam. This study is grounded in the concept of natural language processing (PLN), as discussed by Brown et al. (2020). The research was conducted using the design science methodology, which aims to build and/or evaluate different technological artifacts by applying the proficiency exam questions to GPT-4o, using OpenAI's ChatGPT. While actual statistics for the Proficiency Exam show that only a portion of accountants pass, the results of artificial intelligence (AI) showed that all four editions evaluated passed with at least a 64% success rate. Overall, across the sample analyzed, the GPT-4o AI model achieved 77% accuracy compared to 71% for the GPT-4 model, achieving 84% accuracy in the last two exams using the most recent model. However, on some questions that the GPT-4 model had previously answered correctly, the more recent model ended up answering incorrectly or differently than expected by the question developers. These results contribute to the literature studying the use of AI in accounting, particularly the application of natural language processing models and large language models (LLMs).

Downloads

Download data is not yet available.

Published

2025-09-29

How to Cite

Machado de Freitas, M., Dutra Sallaberry, J., Bruno de Jesus Silva, T., & Silva da Rosa, F. (2025). Evolution of AI in solving accounting problems: A comparison between GPT4 and GPT4o in solving the Accounting Proficiency Exam. Contabilidad Y Negocios, 109–126. https://doi.org/10.18800/contabilidad.2025ESP.005